したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | メール | |

htmltodatサポートスレッド

1</b><font color=#FF0000>(L44UP/ps)</font><b>:2002/11/30(土) 01:48
QA・要望等受け付けるかもしれない(?)スレッドです。
作者にスキルがないのでできないことが多いかとは思います。

2</b><font color=#FF0000>(L44UP/ps)</font><b>:2002/12/03(火) 03:42
とりあえず現状報告。
HTML取得を複数回押すとConnection closed gracefully のエラーになることがあります。
まじめにコネクションを切ってないのでまずい場合がある模様。
あと、EUC->SJIS変換しても化ける場合があります。別に凝ったことはしてないのになぁ。
HTML取得の後に化けるケースは対応できそうですがソース貼り付けの場合がどうも
うまくいかないっぽい。研究中です。
一応手元のバージョンではソース貼り付けのケースを除いては対応できたようなので
もう少しテストしてから差し替えます。

3</b><font color=#FF0000>(L44UP/ps)</font><b>:2002/12/05(木) 07:35
修正版(0.0.6)をアップしました。

4</b><font color=#FF0000>(L44UP/ps)</font><b>:2002/12/16(月) 10:16
0.0.7をアップしました。
今回は微修正のみです。

5ジャス</b><font color=#FF0000>(jXxeRXqw)</font><b>:2002/12/28(土) 16:55
最近移転させられたスレを取り込みたくて、read.cgi7.04pの正規表現を書いてみました。
書いたといっても、正規表現は初めてだったので、悪戦苦闘したあげくできたのはsampleから
空白と数文字を省いただけのものになりましたが・・・。一応変換できるようなのですが、
これで良いのでしょうか?ご教示いただければ幸いです。
正規表現は次の通りです。
read.cgi7.04=m#<DT>([0-9]+).+?(?:<A HREF="mailto:(.+?)">)?<b>(.*?)</b>.*?:(.*?)<DD>(.*)<BR><BR>#mi

6</b><font color=#FF0000>(L44UP/ps)</font><b>:2002/12/28(土) 17:33
>>5
2ちゃんのread.cgiを読むのなら、regexps.txtに入っている「read.cgi7.00?」が
使えると思うのですが。
試されたURLも教えていただけると助かります。

7ジャス</b><font color=#FF0000>(jXxeRXqw)</font><b>:2002/12/28(土) 21:55
早速のレスありがとうございます。試したURLは以下のものです。
http://life.2ch.net/test/read.cgi/lifetr/1040737543/l50
但しさっき気づいたのですが、原因は私の操作ミスでして、私はこのスレをプラウザで
表示させて、ファイルメニューから「名前を付けて保存」しておりました。そうではなく、
このスレへのリンクを右クリックで「対象をファイルに保存」にすると、ご指摘の通り
read.cgi7.00?で変換することができました。
(リンクのページ)http://life.2ch.net/lifetr/subback.html
大変失礼しました。
尚、申し遅れましたが、私は以前に一括変換の際に拡張子htmも対象となるよう要望した
ものです。あの時も素早い対応ありがとうございました。重ねてお礼申し上げます。

8名無しさん:2003/01/12(日) 17:04
>>7
http://cheese.2ch.net/pure/kako/1000/10000/1000052758.html
でためしたところ、「read.cgi7.00?」では1行が長すぎると言われましたが、
ジャスさんの正規表現使ったらOKでした。
両方あったほうがいいかも知れません。

9名無しさん:2003/02/19(水) 11:42
sample.htmlを変換しようとしても1行が長すぎますって出るんですが、なんでですか?

10</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/02/27(木) 19:26
PCを修理に出しててレスが遅くなりました。
>>9
正規表現にはもちろん「sample」をそのまま指定してますよね?
だとするとちょっとわからないです。

11名無しさん:2003/04/03(木) 21:15
「ふぁるがいあ」のレスを、
<b>名前</b>トリップ</b>,メール欄,投稿日ID,本文,題名
の形にするには、正規表現をどの様にすれば良いのでしょうか?

当方には、プログラムの知識が全く御座いません。
お教え頂ければ幸いに存じます。

12</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/04/03(木) 23:37
>>11
変換したいスレのURLを書いて頂ければアドバイスできるかもしれません。
「ふぁるがいあ」でググってみたのですがよくわかりませんでした・・・
(「現在この掲示板はサービスを停止しています」とか言われたので)

1311:2003/04/04(金) 22:05
>>12
こちらです。雑談スレッドのログです。
 
http://www20.tok2.com/home/LEFTy/sinzatu1.html

14</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/04/05(土) 01:10
>>13
正規表現「その他」を使えば2ch標準形式のdatには変換できましたが。

>>11をみると、もしかしてかちゅ〜しゃ形式にしたいのでしょうか?
であれば、変換結果を再度自力でテキストエディタ等で変換して頂くしか
ないかと思います。datファイルは「<>」を「,」に変換すればいいらしいですが、
idxファイルの作り方は知りません。

# そういう情報をお持ちの方がこのスレに書いていただけると
# うれしいのですが、こんな過疎状態では難しいですね・・・w

1511:2003/04/05(土) 12:05
解りました。自力で何とかさせて頂きます。

#過疎状態……2chにスレでも立てれば。
#……荒れるか。

1611:2003/04/06(日) 11:40
2ch標準形式のdatのままで読み込めるエディタはどの様な物が有るのでしょうか?
教えて頂けると有り難いです。

17</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/04/06(日) 20:11
>>11さん
かちゅのログ形式について調べてみたのですが、かなり標準形式とは異なる
独特のもので、単に「<>」を「,」にを変える程度ではまともに読めるものには
ならないようです。(レス番ポップアップ等がまったく効かない)

対処としては、かなり面倒な方法ですが、htmltodatでできたdatファイルを
適当なwebスペースにupしてかちゅからアクセスするという方法があるようです。
(以下の情報を参考にしました。
kage板総合質問スレッド
ttp://kage.monazilla.org/test/read.cgi/kage/037402107/237-245 )

試しに私のサイトにupしてみましたので、以下のURLでかちゅから
アクセスしてみてください。
http://mukiyu.hp.infoseek.co.jp/test/read.cgi?bbs=katju&amp;key=0000000001

1811:2003/04/06(日) 23:26
有り難う御座います。
レス番ポップアップを使うためにDATファイルの書き換えをしていたのですが、
流石に1000以上の書き換えを手動で行うのは、骨が折れます。
更にそれをあと50スレッド以上行おうとしていた自分の正気を疑いたくなってきました。

さて、あとは何処のwebスペースにupすれば良いやら解らないと言うのが問題でして、
今、絶望的に感じている所ですが(泣笑)

19</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/04/07(月) 01:21
>>18
> さて、あとは何処のwebスペースにupすれば良いやら解らないと言うのが問題でして、

無料で利用できるホームページサービスはいくらでもあるので
それらを利用してはいかがでしょう。
http://www.google.com/search?q=%96%B3%97%BF%83z%81%5B%83%80%83y%81%5B%83W&amp;btnG=Google+%8C%9F%8D%F5&amp;num=50&amp;hl=ja&amp;ie=Shift_JIS
アップロードにはFFFTPがお勧めです。

2011:2003/04/07(月) 22:58
>>19
何から何まで色いろとアドバイスを頂き、感謝の言葉も御座いません。

本当に、有り難う御座いました。

2111:2003/04/18(金) 16:34
ええっと、どうやればURLに「?」が入れられるのでしょうか。
ファイル名に「?」は入れられ無いですし……。
アドバイスを頂けるとありがたく思います。

22</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/04/18(金) 18:33
全角の「?」でしょうか?
該当のURL(またはファイル名の例)を教えてください。

2311:2003/04/18(金) 19:34
>>21
半角の「?」です。
例は>17にある様な物です。

24</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/04/18(金) 21:35
すみません、質問の意図を今ひとつ理解できていません。

>>21を読んで、
「htmltodatのURL欄に『?』が入力できない(エラーになる?)」
という意味かと思ったのですが、どうもそういうことではないようですね。

もしかして、>>17
http://mukiyu.hp.infoseek.co.jp/test/read.cgi?bbs=katju&amp;key=0000000001
みたいなURLに向けてファイルをアップロードするにはどうすればいいか、
ということでしょうか?

2511:2003/04/19(土) 03:44
>>24
済みません、説明不足でした。

その通りです。

26</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/04/19(土) 15:57
http://mukiyu.hp.infoseek.co.jp/test/read.cgi?bbs=katju&amp;key=0000000001
の例は、かちゅーしゃからアクセスするためのURLで、実際にUPする
ファイル名とは違います。
上のようなURLをかちゅーしゃでアクセスすると、実際には
http://mukiyu.hp.infoseek.co.jp/katju/dat/0000000001.dat
というURLに対してGETが行われるので、これにあわせてファイルを
UPするようにします。

>>17でリンクした「kage板総合質問スレッド」にも詳しく書いて
下さっている方がいるのでご参照ください。少し引用すると、

> 置くディレクトリは、http://適当なwebスペース/bbsname/dat/に
> bbsnameの部分は、目的の板の板ディレクトリ名にしておく。
> 例 http://kage.monazilla.org/kage/dat/

「適当なwebスペース」の部分は通常自分のアカウントで鯖にログイン
した場合のルートディレクトリになるはずなので、実際にはそこに
bbsname/datのディレクトリを作ってからdatファイルを置くことに
なります。

27</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/04/19(土) 18:24
専用の簡易httpサーバでも書いてみようかな・・・

28</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/04/20(日) 22:10
とふと思ったけど、車輪の再発明以上のものにはなりそうにないのでやめます。
代わりに、と言っては何ですが、datファイルからsubject.txtを生成する機能を
実装中。
これを使ってローカルでhttpサーバを動かしてかちゅーしゃ等からアクセスする
方法についてまとめてみる予定。

29</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/04/22(火) 01:12
>>28について各種2ch用ブラウザで動作を検証中。
>>1」のようなリンクのポップアップがうまくいかないものが多い。
(ホットゾヌ、ギコナビ等)
どうやらhtml上で>>1の前に付加されているアンカータグ<a href=〜>
がそのまま解釈されてしまってうまくいってない模様。
たいていの2ch用ブラウザには>>1のようなリンクにはアンカータグが
なくても自動で補う機能がついているようなので、これに頼ることにして
dat変換時にアンカータグを削除する機能をつけてみることにします。

30</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/04/25(金) 18:18
とりあえずバージョンアップしました。(0.1.0)

・subject.txt生成機能を実装。
・レス本文中のアンカータグ削除機能を実装。
・エラーメッセージ等微修正。

ドキュメントについてはまだこれからです。

31名無しさん:2003/05/14(水) 20:08
「sample」正規表現で過去ログHTMLを変換すると、
コテハン内の空白やトリップ付きコテハンで名前欄の内容の一部が欠落する模様。

ついでに2ちゃんねるプロバイダーの
2ちゃんねるビューアが吐くHTML用正規表現キボンヌ。

3231:2003/05/14(水) 20:38
……と思ったが、ひょんな拍子で2ちゃんねるビューア用正規表現が、
自力で出来てしまったので晒しておく。

m#<DT>(?:<a .+?>)?([0-9]+).+?(?:<A HREF=mailto:(.+?)>)?<b>(.*?)</b></.+>.*?:(.*?)<DD>(.*)<BR><BR>#mi

完璧かどうかは判らないけどね。

3331:2003/05/14(水) 20:38
……と思ったが、ひょんな拍子で2ちゃんねるビューア用正規表現が、
自力で出来てしまったので晒しておく。

m#<DT>(?:<a .+?>)?([0-9]+).+?(?:<A HREF=mailto:(.+?)>)?<b>(.*?)</b></.+>.*?:(.*?)<DD>(.*)<BR><BR>#mi

完璧かどうかは判らないけどね。

3431:2003/05/14(水) 20:39
むぅ、これが2重カキコの罠か。

35</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/05/14(水) 21:50
# サーバーエラーでなかなか書けなかった・・・

>>31さん
「sample」はあくまでサンプルですし、readmeにも書いてるとおり
そのまま使えるとは期待しないでください。

うまくいかないURLの例を書いていただけるとうれしいのですが、
とりあえず以下のようなのではどうでしょうか。

m#<dt>([0-9]+).+?(?:"mailto:(.+?)">)?<b> (.*?) </b>(?:</font>|</a>) 投稿日: (.*?)<dd> ?(.*?)<br><br>#mi

3631:2003/05/14(水) 22:03
↓実際に用があったスレッドとは違いますが、★とかもあってテストに最適
http://pc.2ch.net/nntp/kako/1041/10410/1041061070.html

>>35の正規表現で、ばっちりOKでした。

37</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/05/14(水) 22:52
間違った・・・
m#<dt>([0-9]+).+?(?:"mailto:(.+?)">)?<b> (.*?) </b>(?:</font>|</a>) 投稿日: (.*?)<dd> ?(.*)<br><br>#mi
でないとまずいかもしれません。
(他の正規表現もそうだな・・・見直さなくちゃ)

38fuwa:2003/05/16(金) 11:08
ども。ありがたく使わせていただいています。

さて、以下はおんぷちゃんねるの過去Logなんですが、変換がうまくいきません。
http://www.42ch.net/UploaderSmall/source/1052921487.htm
したらば(www)と>>33さんの正規表現を使いましたが(他の正規表現ではダメ
でした)、イマイチです。
よろしければ正しい正規表現を教えてください。

39</b><font color=#FF0000>(L44UP/ps)</font><b>:2003/05/16(金) 18:36
>>38さん
HTMLソース見ましたがかなり独特ですね。やたら変なところで改行してて。
(投稿日と時刻の間とか、<A の直後とか)

で、正規表現を弄っているうちに、プログラム的に直さないとまずい部分が
発覚してしまったので、修正します。
今日中にはUPできると思うのでしばらくお待ちください。


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板