したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | メール | |

htmltodatサポートスレッド

188 ◆/vmukiyuzw:2005/09/10(土) 13:52:59
>>187さん
これはp2によるHTMLですかね。
Javascript等のガラガラが入りまくりでhtmltodatとしては非常に
苦手なパターンです。

まず、htmltodatの仕様からくる致命的な不都合が2点。

1.htmltodatでは日時・ID欄は一つのものとしてとらえているので
 日時とIDの間に挟まっているものは取り除けません。

2.htmltodatではメール欄は名前欄より前に「mailto:〜」の形式で
 書かれていることを前提にしているので、このHTMLのように
 名前欄の後ろにしかもプレーンテキストでポンと置かれても
 それがメール欄である事を識別するすべがありません。
 (しかもこの形だと日付欄と区別するのも難しい)

とはいえ、名前欄と本文だけはそれなりに取り出せたので一応
書いておきます。後は申し訳ないですがエディタ等で前処理なり
後処理なりして整形してください。

m#<dt.*?>([0-9]+).+?()<b>(.*) </b>.*?:(.*?)</dt>.*<dd> (.*)<br><br></dd>#mi

あと、レス番が256から始まってますがこれをdat変換してもしょうがないので
「全部」のURLで変換してください。
それからスレタイにも余分なものが付いてますのでご注意を。


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板