[
板情報
|
カテゴリランキング
]
したらばTOP
■掲示板に戻る■
全部
1-100
最新50
|
メール
|
1-
101-
201-
301-
401-
501-
601-
701-
801-
901-
1001-
1101-
この機能を使うにはJavaScriptを有効にしてください
|
htmltodatサポートスレッド
161
:
</b><font color=#FF0000>(L44UP/ps)</font><b>
:2005/04/20(水) 20:13:05
>>160
さん
cssが同封されていたり、HTML中に
<META content="MSHTML 6.00.2900.2627" name=GENERATOR>
というのが入っているのを見ると、IEで表示したスレをメニューから
「名前をつけて保存」で保存したもののようですね。
この方法で保存した場合、IEが適当にHTMLを整形・加工してしまうので、
正規表現にヒットしにくくなってしまう場合があります。
なので、htmltodatとしては
・スレのURLを直打ちで取得
・スレへのリンクを右クリック→「対象をファイルに保存」で保存
・適当なダウンロードツール(iria,irvine等)を使う
のいずれかをお勧めします。
とりあえず以下のようなのを書いてみました。
m#<DT><A.*?>([0-9]+).+?(?:<A *HREF="mailto:(.+?)">)?<b>(.*?)</B>(?:</A>|</FONT>) *:(.*?) <DD>(.*)<BR><BR>( <DT>)#mi
一応サンプルの3つのHTMLにはマッチしましたが、上に書いた整形・加工の
影響でdat中に無駄な半角スペースがいくらか入ってしまいます。
(2ch用ブラウザでの見た目上は影響ないはずですが)
あと、これらのHTMLは、タイトルがスレタイではなく
「2ch検索: [dat:
http://qb5.2ch.net/test/read.cgi/operate/1112336659/
]」
のようになっているので、dat変換後に正しいスレタイに変更してください。
(datの1行目の一番最後をテキストエディタで書き換える)
それから、ghard板のHTMLだけなぜかcharsetがEUCですね。
新着レスの表示
名前:
E-mail
(省略可)
:
※書き込む際の注意事項は
こちら
※画像アップローダーは
こちら
(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)
スマートフォン版
掲示板管理者へ連絡
無料レンタル掲示板