したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | メール | |

htmltodatサポートスレッド

206 ◆/vmukiyuzw:2005/10/05(水) 17:49:48
>>205さん
レス遅くなってすみません。
正直手こずりました・・・

名前欄・メール欄のあたりのバリエーションがさまざまで、一発でマッチするパターンが
なかなか見つけられませんでした。
なので、or表現を使いまくって、結果以下のようになりました。

m#<dt.*?>.*?(?:<B>|<FONT.*?>)([0-9]+).+?:(?:<A.*?href="mailto:(.*?)">|<FONT .*?>)(?:<b>| )(.*?) *?(?:</b></font>|</font>|</b></a>|</a>) ?:(.*?) *?<dd.*?> ?(.*?)(<layer|<br> *?<br> *?<A *?id=.*?>|<br> *?<br> *?</d)#mi

かなり複雑な正規表現になってしまったので、変換には結構時間がかかると思います。

あと、文字化けするのはHTMLがgzip圧縮されているためです。(>>43参照)
対処としては
・ログをダウンロードして適当な解凍ツールで解凍(数が多い場合はこれがお勧め)
・ブラウザで表示し、「名前をつけて保存」で保存
・ブラウザで表示し、「ソースの表示」でエディタ等で表示し、保存(これだとHTMLが
 適当に加工されることもないので私としてはお勧め)

htmltodat自体に解凍機能をつけるのは結構大層な改造になってしまうのでできれば
やりたくないのですが、なぜ化けてるのかがわからないのはまずいと思うので、
警告メッセージくらいは出すようにしようかなと思っています。


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板