したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | メール | |

テストその2

1 名無しさん :2002/11/28(木) 00:05
テストその2

2 名無しさん :2002/11/28(木) 00:06
あげ

3 名無しさん :2002/11/28(木) 00:07
さげ

4 名無しさん :2002/11/30(土) 01:58
sage

5 名無しさん :2002/11/30(土) 02:08
test

6 名無しさん :2002/11/30(土) 02:11
test

7 名無しさん :2003/05/07(水) 21:31
m#<DT><A.*?>([0-9]+).+?<B>(?:<A HREF="mailto:(.+?)">)?(.*?)(?:</A>)?</B></FONT> :(.*?)<DD>(.*)<BR><BR>#mi

8 名無しさん :2003/05/14(水) 22:45









9 名無しさん :2003/05/18(日) 02:55
作者様WEBサイト: http://mukiyu.hp.infoseek.co.jp/

10 名無しさん :2003/07/15(火) 22:44
てす

11 </b><font color=#FF0000>(L44UP/ps)</font><b> :2003/07/15(火) 23:07
なんでだろう?
ここには書けるのに本スレには書けない・・・

12 </b><font color=#FF0000>(L44UP/ps)</font><b> :2003/08/15(金) 01:39
Jane用のログ移動ツールを作ってみました。コソーリ公開

13 名無しさん :2003/08/25(月) 15:17
test

14 名無しさん :2003/12/09(火) 18:22
てすと

15 名無しさん :2004/08/26(木) 11:12
jbbs.shitaraba.comで取得した過去ログを
jbbs.livedoor.comに変換したいんですがどうしたら良いでしょうか?

16 </b><font color=#FF0000>(L44UP/ps)</font><b> :2005/02/28(月) 20:10:36
新規スレッド作成を一番下に持っていく方法をやっと発見w

17 </b><font color=#FF0000>(L44UP/ps)</font><b> :2005/03/23(水) 01:35:07
147はなんかの誤爆かな?
リンク先見ても意味わからないんですけど。
悪いけど削除します。

18 トリップ無いけど作者 :2005/04/26(火) 20:26:32
今月に入ってからhtmltodatスレがやたら延びてるのは何故だろう?
何か原因知ってる人いますか?

19 ◆/vmukiyuzw :2005/05/27(金) 22:41:33
JBBSでの透明あぼーんの仕方がやっとわかった。
でも頻度から見て対応すべきだろうか?
とりあえず保留。

20 名無しさん :2005/08/30(火) 17:11:12
test

21 ◆OSAp.AesJU :2005/09/06(火) 21:48:34
ちょっと書き込みテストm(_ _)m

22 名無しさん :2005/09/07(水) 00:01:59
test

23 名無しさん :2005/09/07(水) 17:17:26
aaaaaaaaaaa

24 ◆/vmukiyuzw :2005/09/07(水) 20:46:00
なんか意味のない書き込みを繰り返してる方が若干いらっしゃいますが
ここはそういう掲示板ではないので、続けられるようだと容赦なく
リモホ晒した上でアク禁にしますよ。

25 ID:"cdquxspte8rqn@HG" :2005/09/18(日) 19:12:06
Nickname:"cyber0099"
私はパンヤでチートしています。

CYBER
CYBER-A1
Microsoft Windows XP
CYBER

55383-646-4542535-23682
192.168.1.2

そんな私はハンゲ厨です。

�|����2�|��|��|

26 ◆/vmukiyuzw :2005/09/21(水) 10:33:38
作者自ら200ゲットしてしまったw
しかし最初に作ってからもうすぐ3年かあ。月日の経つのは早いですね。
まあこれからもマッタリやっていきます。

27 ◆/vmukiyuzw :2005/09/29(木) 01:27:19
うはwwwwwwwwwwwwww今日一日でダウンロード数100超えてるwwwwwwwwwwwテラウレシス
こんなことは初めてです
皆様ご愛顧ありがとうございますm(_ _)m

28 ◆/vmukiyuzw :2005/09/30(金) 20:56:32
be鯖へのHTTPリクエストが http/1.1 500 Internal Server Error になってしまう
件について調べていたのですが、リクエストのパラメータをいろいろ変えてみても
どうしてもエラーが消えない・・・。
最後にまさかのまさかと思いつつ、User-Agent をIEと全く同じにしてみたらなんと
エラーが消えました。
UAの違いでInternal Server Errorが出る鯖っていったい何者だ?どんな設定
してるんだろう・・・

29 ◆/vmukiyuzw :2005/09/30(金) 22:17:42
9x系のクライアントだと正規表現欄やHTMLソース欄の右端が欠けてしまって
編集不能になる件ですが、使用しているコンポ(拡張 Memo & RichEdit コンポーネント)
で、右端での折り返し長さを適切に設定しておかないといけなかったようです。
とりあえず、9x系でも全部が表示できるような長さに設定してみました。

30 ◆/vmukiyuzw :2005/10/06(木) 21:08:55
> 名前欄とメール欄の位置が逆になっているHTMLに対応するため、メール欄逆転
> 機能を実装。
についてですが、663さんのjavascript版では変換結果の式自体を指定するように
なっていましたが、本家(?)としては、若干UIが複雑になってしまうと思ったのと、
現実に問題になるのは名前欄とメール欄の位置が逆になるケースくらいだろうと
思ったので、オプションで指定する形にしてみました。
まあ、これ以外で対処できないケースが出てきたらまたそのとき考えるということで。

31 663 :2005/10/12(水) 19:25:40
mukiyuさんに御紹介頂いたので、ずっと未完成のままでしたが
javascript版のhtmltodatを何とかとりあえずの形にしてみました。

http://www.geocities.jp/mirrorhenkan/htmltodat/

大したスクリプトではありませんが、此方を見ておられる方々が
「それって何だ」と思っておられると思いますので(変な言い廻しですが)
こういうものです という事で。。

32 ◆/vmukiyuzw :2005/10/13(木) 00:22:22
>>31
なかなかいい感じになっているではないですか。
# ちなみに、663さんて何者だ?と思っておられる方のためにご紹介
# http://yy14.kakiko.com/mirror/

でもまあ本家のアドバンテージは
・正規表現が選択式であること(かつ自力でカスタマイズできること)
・一括変換ができること
だと思っているので、この辺をjavascriptでやるのは難しそうですね。
(というか、その辺を出来るようにしたいから、もともとperlでやっていた
ことをdelphiで書き直したという経緯もあったりする)

それはともかく、私のほうもバージョンアップ真っ最中です。
ほぼ形にはなりましたがかなり修正したんでreadme修正するのが
めんどくせー^^
まあ数日中にはリリースします。

33 ◆/vmukiyuzw :2005/10/13(木) 20:53:38
さて、次はgzip対応かな・・・
実のところ、HTML取得には、Indyを使うほど細かな制御はしてないなということに
気づいたので、IEコンポ使う方向に変えようかなと思ってます。

34 ◆/vmukiyuzw :2005/10/14(金) 21:42:01
とりあえずgzip対応できました。
IEコンポに逃げようとしたのですがこれはこれで結構難しく
(昔VBで扱ったときは簡単な気がしたのになあ)、結局
Janeやギコナビのソースを参考にしまくって対応しました。

さて、次は変換オプションのファイル保存・呼び出し対応か・・・

35 ◆/vmukiyuzw :2005/10/15(土) 02:24:01
なんか知らないうちにjbbsの掲示板の一番下に
「掲示板管理者へ連絡」とかついてる・・・
これでメールでの問合せとか増えたらなんかやだなあ・・・

36 ◆/vmukiyuzw :2005/10/17(月) 18:00:41
http://pc7.2ch.net/test/read.cgi/software/1125352202/22
みたいな声も出てたのでとりあえずgzip対応版をUPしましょうかね。
変換オプション周りはもう少し考えたいので。

37 ◆/vmukiyuzw :2005/10/26(水) 02:12:39
文字コードの自動判別を実装すべく研究中。
HTTPでの文字コードの指定方法としては
1.MIMEヘッダの中でcharsetパラメタを用いて情報を指定する方法
2.HTML文書の中でMETAタグを用いて情報を指定する方法
の2通りがあって、RFC的には1.が本来あるべき方法であり、2.はあくまで
補助的なものであるらしい。

・・・けど、(少なくともhtmltodatでは)実用上は2.だけ気にしてればいいような
気がする。1.と2.が食い違っていて問題になるようなケースに出くわしたことが
無いだけかもしれないけど。
ファイルに保存したHTMLだとどのみち2.しか使えないというのもあるし。

38 ◆/vmukiyuzw :2005/11/01(火) 21:56:44
ぐぐっていたらこんなブログ見つけた。
ttp://d.hatena.ne.jp/sskm/20051018
htmltodatサポスレに書いてくれたら一発で解決しそうなのに・・・
(とコメント書こうとしたけどユーザー登録しないとコメント書けないみたいなんで
面倒なんでやめたんですが)

39 ◆/vmukiyuzw :2005/11/13(日) 00:31:42
修正するにはしたけどテストするのが面倒くさい・・・
(とプログラマとしては最低のセリフを吐いてみたりする)
ドキュメント修正するのも面倒だし・・・
ちょい体調がイマイチなせいでモチベーションも下降気味です

40 ◆/vmukiyuzw :2005/11/18(金) 01:20:21
test

41 ◆/vmukiyuzw :2005/11/19(土) 01:40:49
この板を作った経緯等についてちょっとメモっときます。

昔、JaneがまだJBBSやまちBBSに対応してなかった頃、ソースは公開されていた
ものの、当時はdelphiで弄って対応できる自信がなかったので、仕事で使っていた
Javaでプロキシソフトを作成して読み書きできないか実験していました。
その実験のために作ったのがこの板です。
(その痕跡が過去ログの「テストその1」スレに残ってます。SJISの機種依存文字を
EUCに変換できるか試していたものです)

で、何とかそれなりの形にはなったのですが、もたもたしてる間にJaneも進化して
JBBS等にも対応してしまったので、世に出す機会がなくなりました。
(あくまで実験用だったので設定とかが難解で実用的じゃなかったのもありますが)
でもそのソフトでも正規表現でdat変換とかやっていたので、これだけでも取り出して
単独のソフトにしてみたら多少は使い道があるかも、と思って作ったのがhtmltodat
です。Janeのちょこっとした改造ならやったことあるのですが、一から作ったのは
delphiでは初めてだったりします(なので未だに初心者レベルなのです^^;

で、サポートスレが必要だなと思ったのですが、2chに立てるほどのニーズはないな
と思ったので、この板を流用しちゃおう、ということで現在に至ります。

42 ◆/vmukiyuzw :2005/11/21(月) 02:09:54
いまさらの話が続きますが、BREGEXP.DLLて勝手に配付していいのかな?
(フリーメールを読むためにJupiter 5てのを使ってるんですがBREGEXP.DLLが
同封されているのに最近気づきました)
作者のBaba氏に確認とか取らなきゃいけないのかな?
・・・でもよく考えてみるとASPを使ってるサイトなんてほぼ確実に使ってますよね。
次からhtmltodatに同封してもいいのかなとか思っています。

43 ◆/vmukiyuzw :2005/11/21(月) 02:25:33
>>42
・・・と書いてからBASP21のサイトを見に行ったら、FAQのページに
思いっきり再配付OKって書いてました・・・
次から同封するようにしますね。これでちょっとインストールの敷居が
低くなってくれると嬉しいんですが。

44 ◆/vmukiyuzw :2005/11/26(土) 22:24:45
メモ
m#<dt><a href.*?>([0-9]+)</a> :<span .*?>(?:<span title=(.*?) class=sage>|<a href="mailto:(.*?)" class=mailto>)?(.*) (?:</a>|</span>)?</span> :(.*?) <br><dd> *?(.*?) <br> *?<br> *?(<a name.*?>|</tl>|</dl>)#mi

45 ◆/vmukiyuzw :2005/12/03(土) 00:53:02
スレの1からdat名を割り出すモジュールはまあそれなりに出来たのですが
これを組み込むのが意外と細かいとこで面倒・・・
通常の変換と一括変換両方ありますしね。まあプログラミング的には簡単
なんでしょうけどあまり面白くはなくて気が向かない、て感じです。
まあ、今週末は予定があって時間が取れないですが来週中には何とか、
てところで。

46 ◆/vmukiyuzw :2005/12/11(日) 21:58:29
しかしまあ、subject.txt作成なんておまけに気まぐれでつけたような機能なのですが
使ってる方は結構いらっしゃるみたいですね^^;
readmeにも使用用途もろくに書いてないのに・・・
まあ作者としては有難いことではありますが。

47 ◆/vmukiyuzw :2005/12/31(土) 14:53:25
メインマシンが故障・・・(液晶バックライトが切れただけみたいですが)
仕方なくサブマシンを起動すると、長い間放置していたせいか、
セーフモードですら起動しない状態・・・やむを得ずOS再インストール。
必要最小限のファイルとアプリだけコピーしてやっと今に至ります。
まったく、大晦日だってのに何やってんだか・・・

で、サブマシンに開発環境を構築するのも難儀なので、修理に出して
返ってくるまで(2週間くらい?)何も手出しできない状態となると
思います。あしからず。

48 ◆/vmukiyuzw :2006/01/03(火) 23:42:48
帰省より復帰。
うちの実家の正月は、がめ煮(一般的には筑前煮と呼ぶものです)を
大量に作る習慣で、美味しいです。いっぱい食べてきました。
甥っ子(5歳)とプロレスごっこで遊んで、意外と強いので汗をかきましたw
あと、任天堂DSで脳年齢チェックしました。62歳でした・・・orz

・・・まあそんなことはさておき、結局「2006/01/01 08:59:60」が表示された
スレは存在したのでしょうか?
今更ながらググってみたら
http://qb5.2ch.net/test/read.cgi/operate/1121886018/674
みたいなレスを見かけたんで、多分なかっただろうと思うのですが。
(イタズラのためだけにbbs.cgiを弄るにはかなりデリケートな部分ですし)

49 ◆/vmukiyuzw :2006/01/05(木) 21:54:32
659さんの掲示板
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1116159529/417
で紹介されていたウィンドウズデベロッパーマガジンを買ってきました。

正直、UTF-8についてはあまり詳しくは知らなかったので、勉強になりました。
文字コード自動判定のVB版コードが載っていましたが、delphiに翻訳するのも
そんなに難しくはなさそうなので、htmltodatに組み込んでみようかなとか
思ってます。今は>>47の通り開発環境が手元にないので何もできないですが。

# しかし、システム屋の最前線から離れてサンデープログラマになってから
# しばらく経つのですが、知らないキーワードがいっぱいで参りました・・・。
# Oracleも10gとか出てるし(てかgが何の略なのかわからない

50 ◆/vmukiyuzw :2006/01/07(土) 19:04:05
http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/437
本家であることを主張しておかないとと思ったので。

・・・というのは冗談で、なんか厨房臭くて恥ずかしいなと思うように
なってきた、というのが理由です。
# 話は飛びますが同様の理由でえまのんのUIとか嫌いです。
# Janeのトレース画面もちょっとだけ嫌です。

51 ◆/vmukiyuzw :2006/01/10(火) 01:18:31
うーむ、直レスするには多少差し障りがある内容を含んでるかなと思ったので
ここでこっそり書いたつもりなのですが、しっかりチェックされてますね^^;
# 659さんのレスは正直言うと意味がわからなかったですが

htmltodatも初期のバージョンではエラーメッセージとかかなり厨房臭かったです。
(使ってくれる人がそんなにいるとは想定してなかったので)
v0.1.0(2003/04/21)「エラーメッセージ等微修正」のあたりでかなり直した記憶が
あります。
「のようなもの」については、正直ついてることさえ忘れていて、
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/218
のレスで気づいてそのうち取ろうと思っていました。
まあ未だにあまり洗練されたUIとは決して言えないので、他アプリのUIをどうこう
言える立場ではないなと多少反省している次第です。今年は多少は向上できたら
いいなと思ってはいるのですが。

# おまけ・・・私の作ったソフトでバージョン毎のダウンロード数が一番多いのは
# 実はJaneLogMover0.0.3である。これってトリビアになりませんか?(なるかよw

52 ◆/vmukiyuzw :2006/01/10(火) 02:08:24
>>51書いてから気づいた・・・JaneLogMoverにも「のようなもの」付けちゃってる.。
でもこっちは特にバージョンアップの要望とか予定とかないしなあ・・・
バージョン変えずに「のようなもの」だけ取るのもありかも知れませんが。

53 ◆/vmukiyuzw :2006/01/17(火) 23:28:50
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1116159529/512
そういうことではないと思います。プレビュー欄はIEコンポ使ってるのでコピペも
ソースの表示とかも出来ますし。

・・・しかしヒントにはなりました。
元HTMLとプレビュー欄のHTMLの両方を適当なエディタ(できれば正規表現が
使えるもの)でソース表示して、不要な部分を削除して、コンペア(これも大概の
エディタではできるはず)すればいいのではないかと。
まあ面倒っちゃ面倒かもしれませんが。

54 ◆/vmukiyuzw :2006/01/24(火) 02:11:10
229.167.150.220.ap.yournet.ne.jp アク禁にしました。(って見ちゃいないでしょーけど)

55 ◆/vmukiyuzw :2006/01/24(火) 02:20:46
理由書き忘れた。
業者スレ立てを繰り返しているので。

ついでに、この板の新規スレ立て自体、現状では不要かなと思うのでとりあえず停止しました。
必要があるなら(ないと思いますが)ここでご連絡を。

56 ◆/vmukiyuzw :2006/02/04(土) 21:05:59
http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/479
自分では「ctrl+v」以外使うことはまずないので全然気づきませんでした。
で、質問してみたのですが
http://pc8.2ch.net/test/read.cgi/tech/1138370150/114-115
自力で実装するしかないようです。
まあサンプルは見つけたのでぼちぼちとやります。

57 ◆/vmukiyuzw :2006/03/04(土) 23:04:51
たまたま見つけたのですが
ttp://kataemariwe25.dw.land.to/test/read.cgi/daddycool/1119634579/
の562,570
この頃には「read.cgi7.00?」に若干の不具合があったのでその影響ですかね
まあ半年以上も前の話なのでどうしようもないんですが

58 ◆/vmukiyuzw :2006/03/30(木) 00:54:00
663さんのミラー変換機がネトランに載ったそうで(おめでとうです)
それはいい事なんですが跳ね返りでここに厨房が沸いてこないか不安です(自意識過剰かな)
対処できる自信がないので・・・

59 ◆/vmukiyuzw :2006/04/08(土) 00:13:04
htmltodatが簡易ブラクラチェッカーとして使えることに気づいて
そういう使い方がメインな今日この頃w ←てかさっさと更新しろよ

60 ◆/vmukiyuzw :2006/04/18(火) 01:52:39
http://pc7.2ch.net/test/read.cgi/software/1143611320/360-362
やっぱ見た目ごちゃごちゃしてると言われるのは仕方ないです・・・
メニューバーを付けて使用頻度の少ないものをまとめればばもう少し
整理できそうな気もするんですがそれはそれでアクションが増えて
しまいそうのでどうしたもんかってのが考えどころです。

61 ◆/vmukiyuzw :2006/05/28(日) 02:49:42
htmltodatの前処理wコマンドの拡張についてですが・・・
もともと単に前処理のデバッグ機能的に付けようと思ったのですが、前処理を付けてしまった(?)た副作用で
いろいろできるようになったんで、ストリームエディタ的な使い方が出来てもそれはそれで面白いかなと思ったので・・・

で、こういうことになってしまった次第です。ほんと気まぐれで、本来のhtmltodatの用途とはほとんど関係ないです。
が、こういう用途にも使ってもらえるとそれはそれでいいかなと(て使いたいという人がいるのかという気がしますが)
て感じです。

62 ◆/vmukiyuzw :2006/05/28(日) 22:23:11
なんか最近業者がよく来るのでしたらばのカテゴリーに公開しないようにしました。
(そこから検索して来るお客さんはほとんどいないと思うので)
でもしたらばのカテゴリ名は数字の連番(うちの板は1929)なんで番号をたどって
来るような人には対処のしようがないです。あーうっとうしい・・・

63 ◆/vmukiyuzw :2006/07/10(月) 00:13:58
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1116159529/792

まあ正直言ってしまうと、別に具体的なURLが知りたいという意図ではなく
「調べればわかるだろうけどお前の態度が気に入らない」ってとこですかね
まあ基本的には人間小さい奴ですから

64 ◆/vmukiyuzw :2006/07/10(月) 00:53:02
誤解を招かないように一応
> お前の態度が気に入らない」ってとこですかね
もちろん659さんのことではなく332の人のことです
とはいえちょいと言いすぎかなと若干反省。

65 ◆/vmukiyuzw :2006/07/16(日) 21:23:52
http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/705,707
proxomitron以外でもHTTPヘッダを見られるツールはありますが
とりあえず一番メジャーかなと思って名前を挙げただけです
個人的にはヘッダと内容を両方モニタできる某ツールを併用してます

HTTPヘッダの情報なんて、自分で通信アプリを作ろうとか
いう人以外にはほとんど意味の無いものかも知れませんが
一応詳細は以下など
http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616

66 ◆/vmukiyuzw :2006/07/22(土) 01:19:40
http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/712

>> てかいっそxyzzyでhtmltodat的処理を書いてしまうというのはどうでしょう?
> ここここれはわわわ私に言っててるのですすかかか

そうです。まあお時間があればでいいですがw
というか自分的にはhtmltodatはなるべく汎用性を目指したいと思って作ってきた
つもりですが、そこにこだわらなければどんなツールでもhtml→dat変換は出来る
はずなんです。別に正規表現とかも必須では無いですし。
なので、他に手段があるのであればそれでやればいいじゃないのという考えです。

67 ◆/vmukiyuzw :2006/08/29(火) 00:46:39
http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/757-758
以下ほとんど独り言なのでこちらに書きます

> s#<a href="read.php?host=[^>]+?>(\d+)</a>#$1#g
「[^>]+?>」は多分単に「.+?>」でいけるはずです

何故こんな細かいとこに言及するかというと、まあsedやawkしかない
時代から正規表現と付き合ってきたというのがあって、perlの正規表現
(という言い方も正確なのかどうかわからない。正規表現の種類にバージョン
番号とかあればいいんですが)にはsedやawkにはない最短一致というのが
あるというのを知って、これは便利だと思ったわけです。
(昔の正規表現には最長一致しかなかった)
# ちなみに、最長一致というのは文字列を検索していってマッチする一番遠い
# ところを探す、最短一致は逆に一番近いところを探す、てな意味です

何が便利かって、まさにHTML文書を検索するようなケースで、HTMLってのは
基本的にはタグが「<」と「>」のペアで出てくるので、「<」が出てきたら次の「>」
までを検索したいケースが多いと思うのです。でも正規表現のデフォルトだと
最長一致になってしまうので、まさに上で書いたような「[^>]*>」(意味的には
一番近い「>」を探す)みたいな書き方を多用せざるを得なくなるのです。
そういう意味で最短一致「.*?」とか「.+?」みたいな書き方が出来るのは非常に
便利だしわかりやすくもあるので使える局面なら是非使うべきだと思うわけです。

68 ◆/vmukiyuzw :2006/08/30(水) 01:58:11
たまにはどうでもいい話題など・・・

今日、エアコンからいきなりポタポタ水が漏れてきたのです。
「やばい、故障か?」と思ったのですが、とりあえず2chの
家電製品板に行くと、見事にエアコン修理に関するスレが
あったのです。
そこを見てなんかいろいろやってみたらとりあえず直ったような・・・
まあまだわからないので修理を呼ばないといけないかもですが
とりあえずにでもすぐに情報が得られて対処できたのは
便利な時代になったもんだな〜と思った次第です

69 ◆/vmukiyuzw :2006/10/28(土) 03:58:16
数日前からVIP板の投稿日が

 佐賀暦2006年,2006/10/27(佐賀県と汚職) 19:43:23.16

みたいなことになっちゃってるので、
htmltodatの「レス1の投稿日時からdatファイル名を取得する機能」に影響がないか一応確認。

実はこの投稿日時を抜き出す処理自体、内部的には正規表現を使っていて、

 m#^.*?(\d*/\d*/\d*).*? *(\d*:\d*(:\d*)?)#

こんなパターンでマッチさせてたりします。
で、2回出てくる .*? が佐賀うんぬんの部分にマッチしてくれるため、問題は発生しませんでした。


ところで、影響うけてるものもあるようで。
http://jane.s28.xrea.com/test/read.cgi/bbs/1160222864/385,388

Jane Styleには「n日以内の新着レスからXX個までの画像を自動で開く」という機能があるのですが
「n日以内の〜」の判定は投稿日時欄を見るしかないと思うので、多分佐賀暦に邪魔されてるのかなと。
ってhtmltodatでも 2006/03/32 でやられましたし他人事には思えなかったりします。

70 ◆/vmukiyuzw :2006/10/28(土) 04:27:08
ところで、>>69の確認をしてるときに気づいたことが。

VIPの適当なスレのHTMLを取得しようとしたのですが普通のブラウザでは「人大杉」になってしまうので
Janeで取得したdatをDAT2HTMLでHTMLにしてソースにしました。
当然正規表現は「DAT2HTML0.26」を選ぶべきところなのですが何故か勘違いして「read.cgi7.00?」を選択。
あれ?なんとこれでも正常に変換できるではないですか。

過去ログ追いかけてみるとv0.7.1のときに「read.cgi7.00?」を修正して差し替えてました。
このときの修正で結果的に「DAT2HTML0.26」を包含する形になったようです。
研究すればもっと汎用的なパターンができるかも。

71 ◆/vmukiyuzw :2006/11/04(土) 00:32:32
勉強を兼ねつつ、いろいろ調べごとを重ねる日々。
新たに得る知識は結構あるけれども、実戦(?)にはなかなか至らない。
わからないことを調べていると途中でまたわからないことに出会い、
どんどん枝分かれしていく。収束する時は来るのだろうか。


・・・ともあれ、それらの枝の一つで興味深いものを見つけたのでメモっときます。

「鬼車」という、かなり高機能らしい正規表現ライブラリがあるのですが、
それをラッピングして、かつbregexp.dll互換の機能を実装したライブラリを作った方がおられます。
ttp://homepage3.nifty.com/k-takata/mysoft/bregonig.html

この bregonig.dll を htmltodat.exe と同じフォルダに持ってきて、名前を bregexp.dll にリネーム
(もちろんオリジナルは退避した後で)すると、それだけで使えます。
本家ではサポートされていない、より新しいバージョンの正規表現機能が使えるのみならず、
パフォーマンスも良さげ?なので、しばらく試用してみようかなと思っています。

# しかし、ラップ元の「鬼車」は各種文字コードに対応しているのに、
# 「bregonig.dll は Bregexp.dll との互換性のため、ASCII と Shift_JIS 以
# 外の文字エンコーディングは使用できません。」
# だそうです。ちょっと残念。

72 ◆/vmukiyuzw :2006/11/06(月) 22:46:50
http://yy14.kakiko.com/test/read.cgi/mirror/1158402994/85

LISPを使ったものではなくあくまで手動ですが、xyzzyの正規表現置換機能で
UTF-8のHTMLをdatに変換してみました。
対象にしたスレは http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/336 に上げて頂いた
http://web.archive.org/web/20030425012552/world2ch.net/test/read.cgi/accuse/1048754153/1-100 です。

検索:
<dt>\([0-9]+\).*?\(?:<a href="mailto:\(.*?\)">\)?<b>\(.*\)</b>\(?:</font>\|</a>\): \(.*?\)</dt><br><dd>\(.*\)<br><br></dd>
置換:
\3<>\2<>\4<>\5<>

スレの前後の不要な部分は手動で取り除き、スレタイはレス1の最後に手動で付加すると。

…ところで、これをJaneNidaで正常に読ませるにはどうしたらいいんでしょうか…
適当なフォルダにおいて読ませるだけではSJIS扱いされて文字化けしちゃうんですが。

73 ◆/vmukiyuzw :2006/11/06(月) 23:02:22
ところでこれは>>66で書いたように「どんなツールでもできるはず」をふとやってみようと思っただけです。
結局(楽なので)正規表現使っちゃいましたが^^;

ちなみにxyzzyで使える正規表現はこちら
ttp://xyzzy.s53.xrea.com/reference/wiki.cgi?p=%C0%B5%B5%AC%C9%BD%B8%BD%A4%CE%C9%BD%B5%AD
を参考にしました。
基本はhtmltodatでやってることと変わらないのですが、使える表現が微妙に異なり
括弧とかの前にいちいち\を付けないといけないのが面倒かなと思いました。

74 名無しさん :2006/11/09(木) 00:03:45
NidaはWorld2chの対応ロジックは消しちゃったんじゃないかな
JaneでUTFの多言語表示に対応しようと思ったらSjisじゃなくて
Unicode表示にしないと意味無からねぇ

75 ◆/vmukiyuzw :2006/11/09(木) 01:37:36
>>74
うむ、確かにJaneNida.txtにもそのようなことが書いてありますね(Nida040916)
これ以前のバージョンが手に入らないかなあとNidaのサイト見てみましたが
過去バージョンは置いてなさげ。

仕方ないかとあきらめかけたのですが、ふと思いついて
xyzzyの2ch-modeを試してみたところ、読めてしまったような…!
これぞ灯台下暗し?

今日はもう遅いので詳細は後日にでも。

76 ◆/vmukiyuzw :2006/11/10(金) 22:03:52
>>75の続き

>>72の方法で変換したdatを2ch-mode配下の適当なログフォルダに置いて
読ませてみました。
文字自体は日本語もハングルも化けずに一応表示できました。
自動で文字コード識別してくれるのですね。やっぱxyzzyは基本からよくできてる。

が、一つ別の問題が。
アンカータグ(<a href=〜>とか)の文字列がそのまま表示されてしまいます。
文字コードがUTF-8なこととは関係ないような気がするのですがよくわからない…
とりあえずアンカータグを取っ払うことにしました。
# 大抵の2ch専用ブラウザではアンカータグがなくても自動で補ってくれる機能がついているので。
# (ちなみにhtmltodatでもデフォルトではアンカータグを削除するようにしています)

いったん2ch-modeを終了してエディタモードでdatを開きなおし、<a href.*?> と </a> を全て削除し、
上書き保存しました。
その後、2ch-modeを再起動してスレを読み込ませたところ、今度はほぼ上手くいってる模様。
# ハングル文字で書かれたレスに対するレスアンカーをポップアップさせると文字化けしてしまいますが
# まあそれくらいのことは気にしないことにしよう。作り手側が多分意図していない無理やりな使い方で
# たまたま上手く行ったようなものだし。

77 ◆/vmukiyuzw :2006/11/10(金) 22:33:41
ところでこれは、UTF-8のHTMLをUTF-8のdatに(SJISを介せず)変換し
それをUTF-8対応の2ch専用ブラウザで読めるかどうかの検証だったので、
目的としては一応うまくいったといえると思います。

で、この結果の上で、本家htmltodatとしては何をすべきか・・・?
(別に何もしなくてもいいのかもしれないですがw)

78 ◆/vmukiyuzw :2006/11/25(土) 00:53:46
ふと、かつてよく出入りしていたORACLEとかACCESSとかの掲示板に行ってみました。
コテハン使ってたし全文検索できる掲示板なので名前で検索してみました。

意外なほどたくさん書き込みしてて、我ながら凄いなと思うような書き込みも多々あったのですが、
凄すぎて何を書いてるのか理解できないものもかなり多いwww

・・・いや笑ってる場合ではなく、これは自分の知能がリアルで低下してるのかなぁとw
そして今のこの掲示板に書いてることも近い未来には理解できなくなるのかもしれないと。
まあどうしようもないことかも知れないのですが、自分の成果物(?)をどういう形で残していくか
もしくは放置するか。少し考え込んでしまいました。

79 ◆/vmukiyuzw :2006/12/31(日) 00:57:16
今年ももう終わりですねえ。

そういえば昨年末には>>47みたいなことがあったなあ・・・と思って
ふとサブマシンを起動してみるとまた壊れてる・・・もう笑うしかないです。
(レジストリファイルが壊れてるらしく認識できていない。セーフモードでは
一応起動できるもののそこから何も操作できない)
またOS再インストール。環境整えるのももう面倒なのでそのままです。

・・・しかし使い倒して壊れるのなら納得もいくのですが、使ってないのに
壊れるというのは何故なんでしょうね。
そういえば、VHSのビデオデッキを2台持っていたのですが
メインで使用していた方がテープの巻き込みをするようになってしまい
仕方なくサブ(ほとんど使ってなかった)を使おうとすると
やはりテープを巻き込んでしまい使い物にならない。
結局2台とも廃棄する羽目になってしまったということもありました。

で、ふと考えたのですが、今のメインマシンが壊れたらどうしようと。
いろいろとソフトを導入しているんで使えなくなったらとても困るなあ。
なので、外付けHDDとバックアップソフトの購入を検討中です。
来年早々にも買いに行こうかな。

80 ◆/vmukiyuzw :2007/01/03(水) 23:52:26
いまさらですがあけましておめでとうございます。
今年の抱負としては、なんか新しいソフトでも作ってみようかなあ。
でも何にもアイデアがうかばない^^;
やはり例年通りグダグダな年になってしまいそうです^^;

81 ◆/vmukiyuzw :2007/01/15(月) 22:33:42
さて、>>79でも書きましたが外付けHDDを買ってきました。
バッファローの250GB。おまけのソフトにAcronis True Imageが
ついてくるのが選択の決め手でした
(バックアップソフト比較スレ等で評判がよかったので)。

そんで早速バックアップ取ってみたのですが、時間かかるかかる。
30GBくらいのバックアップにほぼ10時間かかりました。
試しに100MBくらいのファイルを本体から外付けHDDに
単純にコピペしてみたところ、3分くらいかかりました。
30GB/100MB*3分/60だと15時間くらいになるので、やっぱ
外付けHDD(への転送)自体が遅いのかなあ。
ソフトに圧縮機能があり多少サイズは小さくなってるので
まだ10時間で収まった、とも言えるかも。

本体がもう5年くらい前に買ったノートPCなんで
接続はUSB1.1なんです。2.0だとどれくらい違うんだろうか。

82 ◆/vmukiyuzw :2007/01/17(水) 22:13:04
調べてみるとUSB1.1というのはかなり遅いインターフェースのようで。
対応製品の仕様とか見てると「最大12Mbps」とか見かけます。
LANより遅いのね。まあ前世代のものなので仕方ないか。

これがUSB2.0だと「最大480Mbps」とかになるようで。40倍ですね。
USB2.0インターフェイスPCカードが手軽な値段であるので買おうかな。

83 ◆/vmukiyuzw :2007/01/24(水) 21:37:54
USB2.0インターフェースPCカード買いました。
早速バックアップ取ってみると・・・1時間弱てとこでしょうか。
40倍とはいきませんでしたが、まあこれならまだ実用に
耐えるかなという感じです。
CD-ROMからのブートでもちゃんと外付けHDDを認識しました。

これでいつ壊れても安心。ってなるべくならそんな日は
来ないほうがいいのですが。

84 ◆/vmukiyuzw :2007/02/08(木) 00:25:53
たまたま見つけたんですが
ttp://nanabit.net/python/html2dat.html

htmltodatでいうと「read.cgi7.00?」相当の変換ができるようです。
しかしActivePythonインストールが必要、かつコマンドプロンプトでの
実行が必要みたいで。

自分的にはもともとこういうスクリプトでやってたことをUIをかぶせれば
もう少し使える範囲が広がるかなと思って作ったって経緯もあるんで
方向性の違いかなていうことか。

まあhtmltodatも「正規表現とかわからん」とかいう意見が多いわけで
そういう方にはおすすめかもしれないです。

85 ◆/vmukiyuzw :2007/02/26(月) 21:06:20
http://yy14.kakiko.com/test/read.cgi/mirror/1158402994/526

私も試して見ましたが問題なく変換できますね。

まあ推測に過ぎませんが
http://ex20.2ch.net/test/read.cgi/gline/1165651379/638 さんは
単純に手順の間違いじゃないですかねー
前処理を貼り付けるのを飛ばしてるとかそんな感じがします。

あと
http://ex20.2ch.net/test/read.cgi/gline/1165651379/640 (659さん)は
「全部」のURLでやっていないだけのように思えます。
「その9」のデフォルト表示では全レス表示されてないようなので。

86 ◆/vmukiyuzw :2007/03/03(土) 20:54:55
くだらないことですが。
最近、
「ご教授ください」
「×ご教授
 ○ご教示」
「ご教授でも間違いではないよ」
みたいなやりとりをよく見かけるような気がして、調べて見ました。

------------------------------------------------------------------------
大辞林 第二版 (三省堂)

きょうじゅ けう― 【教授】<

(名)スル

(1) 0 1 (ア)児童・生徒に知識・技能を与え、そこからさらに知識への興味を呼び起こすこと。

(イ)専門的な学問・技芸を教えること。
「国文学を―する」「書道―」

(2) 0 大学などの高等教育機関において、専門の学問・技能を教え、また自らは研究に従事する人の職名。助教授・講師の上位。
------------------------------------------------------------------------

確かに間違いではないように思えますね。

87 ◆/vmukiyuzw :2007/03/13(火) 23:58:38
いきなり言っちゃいますが、正規表現というのは危険です^^;

解析するエンジンと実際に書かれる表現とそれにマッチさせる文字列の
組み合わせにもよりますが、書きようによってはスタック領域(って何?まあプログラムが
使うメモリ領域の一部と理解してください)を食いつぶして自爆するようなことが
簡単にできたりします。
以前、bregexp.dllが「fatal error」を起すのはバグじゃないかみたいな書き方をしたことが
あるのですが、そうではなくおそらく上記制限に引っかかって起こる現象ではないかと
今は思います。

そういう危ないものをユーザが自由に指定できるようなソフトを公開していること自体
いかがなものかと思われるかもしれないですが、現実にはそういうソフトは世の中に
山ほどありますし(テキストエディタとか大抵できますしね)
まあ「気をつけたほうがいいですよ」ぐらいしか言えないです。

で、だらだらと書いて結局何を言いたいかと言うと、
「エンジンを新しいものにすれば不具合は解消される可能性がある」
ってことで。具体的には>>71で書いたものなんですが。
興味のある方には使ってみていただきたいなあと思う次第です。

88 ◆/vmukiyuzw :2007/03/18(日) 03:40:12
なんかちょっとPCのキーボードの調子が悪いです
また修理に出さないといけないかも・・・
そうなるとメンテナンスとかバージョンアップとかしばらく無理なので
ご容赦ください。

89 ◆/vmukiyuzw :2007/03/21(水) 00:02:01
http://www2.pf-x.net/~soft186/kako/index.html
こんなソフトウェア板の過去ログ保存サイトを見つけたんですが
http://mukiyu.hp.infoseek.co.jp/をリンクしていただいてるので)
こんなスレがありまして。

■こんなソフトウェアってありますか?〜Part46〜■
http://www2.pf-x.net/~soft186/kako/1073664639.html

以下適当に引用。
-----------------------------------------------------------
15 名前:名無しさん@お腹いっぱい。 :04/01/10 12:35 ID:nzs4W2Ci
htmlからdatに変換できるツールないですか?

24 名前:名無しさん@お腹いっぱい。 :04/01/10 13:21 ID:nX+R5d+/
>22
検索して10秒で見つかる
http://mukiyu.hp.infoseek.co.jp/

27 名前:名無しさん@お腹いっぱい。 :04/01/10 13:24 ID:nzs4W2Ci
>>24
あ、それなんか無理だった。
なんか、2chとまちBのhtmlをdatに変換したいんだけど、
正規表現?が二つともなかったから出来なかった。

29 名前:名無しさん@お腹いっぱい。 :04/01/10 13:27 ID:nX+R5d+/
>27
多分死ねばいいと思います。
2ちゃんと町BBSは別物だし。

htmltodatのようなもの Ver 0.1.4 Copyright(C) 2002-2003 by mukiyu
【概要】
2ch形式のHTMLをdat形式に変換するソフトです。

30 名前:名無しさん@お腹いっぱい。 :04/01/10 13:28 ID:nzs4W2Ci
>>29
でも、正規表現にまちBが入ってますが?

31 名前:名無しさん@お腹いっぱい。 :04/01/10 13:29 ID:nX+R5d+/
>30
ヽ(´ー`)ノ もうお手上げです
これ以上おいらをいじめないで下さい
--------------------------------------------------------------

そういえばまちBBSの正規表現なんて、JaneでまだまちBBSがサポートされてなかった
頃以来使ったことがないし、htmltodatサポートスレにも質問来たこともないし、
いつのまにかHTMLの形式が変わったんでしょうか・・・
と思っていくつか試してみたら、今でも特に問題なく変換できるではないですか。

どこが無理だったのか、もはや3年以上も前のレスなので知るすべもないですが
こういうのはたまたま見つけてしまうとなんとも気になってしまうものです。

90 ◆/vmukiyuzw :2007/04/12(木) 00:47:31
http://pc11.2ch.net/test/read.cgi/software/1169819680/777

Jane自体にはdatを書き換えるような機能はないですし、
htmltodatも結局は特定目的のテキスト編集加工ツールなので
その意味内容を解釈して加工するようなことはできないですね。
(2000年以降限定で年の前に'20'をつけるくらいはできるでしょうが)

自分がやるならexcelに読ませて加工して書き戻すとかですかね
年の4桁表示は書式で何とかなりそうですし、曜日の表示は
関数を応用すればこれも何とかなりそうですし。

・・・で具体的な手順は、と問われると面倒そうなのでレスは避けたんですが。

91 ◆/vmukiyuzw :2007/04/23(月) 02:03:50
前に書いたような気がしますが、フリーメールの送受信に
Jupiter5っていうソフトを使っています。
これは、フリーメール(大抵はwebメールですね)を普通のメーラーで
送受信できるようにしてくれる、ある種プロキシ的な動作をするソフトで、
結構便利なものです。

なんでこのソフトの話をするかというと、webメールの送受信をするために
そのサイトに対応するスクリプトを指定する方式になっているので、
その点でhtmltodatとちょっと似てるなと前から思っていたのです。
Jupiter5のほうが作られたのは先ですしJavaScriptで指定する方式ですし
全然違うじゃんと思われるかもしれませんが、発想が似てるかもって。
(真似したわけではありませんです)

で、今日たまたまinfoseekのメールを読むのにログインエラーになって
しまったので、ちょっとサポート掲示板を見に行ったところ解決したのですが
(タイトルの「infoseek」を「Infoseek」に変えたのでヒットしなくなった)
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/461
と同様な苦労を感じてなんか切なくなった、ということで書いた次第です。

参照されてる可能性があるものを気分次第(?)で変えて欲しくないなあ
と思うのは少数派の参照する側のわがままかも知れませんけど。

92 ◆/vmukiyuzw :2007/05/20(日) 22:03:57
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1164941934/249-250
FATとかの単語を使っていて思い出したのですが。

まだ昭和の時代に書かれた、「MS-DOSとは何か」という本を持ってるのですが
(著者はコンピュータ関連の本を沢山書かれてる脇英世さんという学者さんです)
講談社ブルーバックスの、当時たった620円の本なのですがこれがとんでもなく
内容が濃い本でして・・・
パソコンの歴史に始まり、OSとはなにかと言う解説を語った後、MS-DOSの仕組みを
メモリ構造の具体的な図解やダンプリストなど交えながら詳細に記述してある
本で、もちろんFATの構造についても詳しく書いてあります。
ものすごく勉強になりましたし、今読んでも参考になる部分があります。

・・・で思ったのは、たかだか250ページくらいの本で基本的なことを学べる時代に
遭遇できていたのはある意味ラッキーだったかもって。
今のWindows等で同等のレベルの本を書こうと思うと多分とんでもない量に
なっちゃうんじゃないでしょうか。今から基礎をやろうと思う人は大変だろうなと思うわけです。

93 ◆/vmukiyuzw :2007/05/28(月) 00:52:09
http://yy14.kakiko.com/test/read.cgi/mirror/1158402994/732

> 【検索】姪
> http://wannabe.fam.cx/service/2ch_01/search.cgi?str=%CC%C5

で検索してみると引っかかるスレタイは例えば
「路面電車バカにするな」
「【あべし】「北斗の拳」がMMORPG化決定!【たわば】 」

で、EUCのヘキサでみると「面電」→CC CC C5 C5
「北斗」→CB CC C5 CD
2バイト文字の2バイト目と次の文字の1バイト目で引っかかってるようです。
検索するプログラムのほうがマルチバイト文字を意識して作られてないと
こういうことになっちゃうんでしょうね。
さらに検索してる文字が一文字なのでこういうことになる可能性が
高まったとも思われます。

で、文字コードの観点から見ると・・・と書きかけたんですがすごい長文になって
しまいそうなのでやめときますw

94 ◆/vmukiyuzw :2007/05/29(火) 02:26:21
唐突ですが、ふと気になってCD棚を探して見るとZARDのアルバムが
一枚だけ見つかったのです。
「揺れる想い」というタイトルで、もちろんタイトル曲とか「負けないで」とか
収録されてる奴です。
多分、「揺れる想い」という曲が好きだったんで買ったんだろうと思います。
昔のことであまり覚えてないですけど。

で久しぶりに聞きながら歌詞カードとか眺めてたんですが
「揺れる想い」も「負けないで」も織田哲郎さん作曲なのですね。
・・・とここでまた気になってCD棚を探しに行くと、織田哲郎さんが
他のアーティストに提供したいろんな曲をセルフカバーした
アルバムも見つかったりして。
(織田さんバージョンの「揺れる想い」も収録されています
あと坂井泉水さん作詞のDEENの「翼を広げて」とかもあります)
これもまた聞いてみたり。
と坂井泉水さんを追悼しながらいろいろ懐かしい世界にちょっと浸ってました。

・・・でさらに話は飛ぶのですが、織田哲郎さんの最近の仕事で
思い浮かぶのは、アニメきらりんレボリューションの月島きらり
(モー娘。の久住小春さん)のプロデュース。
でも、織田さんが月島きらりをセルフカバーするのだけはどうしても
想像がつかなくて、つい笑ってしまった次第で。

95 ◆/vmukiyuzw :2007/06/10(日) 02:18:48
バージョンアップに向けいろいろ下調べとかしてるとこだったんですが・・・
先日DVD・HDDレコーダーの電源を入れるといきなり
「ハードディスクの容量が少なくなっています」て警告メッセージが・・・
残したいものはDVDに焼いて、いらないものはそのまま消して、て整理しないといけないんですが
これが意外に時間がかかる。しばらくこれに時間を取られてしまいそうで。

まあ今までもそうだったんですがいつバーションアップするとかは
ほんとに気分次第なので、期待してる人もそんなにいないとは思うのですが
まあその通りで期待しないでくださいねて感じです。

96 ◆/vmukiyuzw :2007/06/17(日) 02:06:24
http://yy14.kakiko.com/test/read.cgi/mirror/1158402994/754
肯定先読みというのは、検索するアルゴリズムから見ると
「ヒットするものを見つけたから次へ行こう!」じゃなくて
ヒットしたものを見つけても元へ戻ってまた探す、みたいな感じなようですね。
これはオリジナルのbregexp.dllではサポートされていないですね。
鬼車バージョンではサポートされてますけど。

でもまあhtmltodat的には多分あまり必要性がないような気がします
というか基本的にそんなに難しい正規表現が必要なケースは
それほどないと思っています。

元のdatがhtmlにされる段階で改竄(といっては失礼か)されて
元に戻すことが困難になるケースはたびたびあると思いますが。
(にくちゃんねるとかはまさにそうでしたね)

97 ◆/vmukiyuzw :2007/07/05(木) 02:07:52
詳細は省略しますが
http://pc11.2ch.net/test/read.cgi/software/1181762211/830
> ヴィスタ化は世の中の流れだと思いますが
> XPはどうせ見放されます。それは確実です。

そうなんですかね?
私は知り合いに「逆にXPのPCが値割れしてるから今が買い時かも」
って勧めてしまったんですが。
XPは確か2011年までサポート継続されたそうですし逆にvistaは
2年ほどで次のバージョン出るそうですし。

それよりも言いたいのは、自分もフリーソフト作ってる立場として、
OSがバージョンアップされたからといって、それにあわせて
作者の環境も(ソフトもハードも)バージョンアップしなきゃ
いけないんでしょうか?ってことです。
もともとフリーだから趣味で作ってるのに、悪い言い方すれば
作者に「さっさと新環境揃えろよ」と言われてるようで、
でもそりゃ人それぞれ都合があるだろうと思うわけで
いかがなものかと思うわけです。

98 ◆/vmukiyuzw :2007/09/30(日) 02:20:26
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/486

> m#<dt><a.*?>([0-9]+).+?(?:"mailto:(.+?)">)?<b>(.+)</b>(?:</a>|</b>).*?:(.*?)<dd>(.*)<br><br>#mi

さらっと書いちゃって、実際ちゃんと動作するのですが
(引用していいのかな)

<a name="a1"></a><dt><a href="menu:1">1</a> 名前:<font color="forestgreen"><a href="mailto:sage"><b>僕ドザえもん</b></a></b></font> 投稿日:2006/04/11(火) 23:49:36 ID:36X3fpBJ0<dd> 魔方陣を書いて「出でよ悪魔」と叫べばおk <br><br>

<a name="a2"></a><dt><a href="menu:2">2</a> 名前:<font color="forestgreen"><b>酋長 </b>◆occulTjdPc <b></b></b></font> 投稿日:2006/04/11(火) 23:50:29 ID:5fhQaGfM0<dd> 酋長が召還された <br><br>


に対して

<b>(.+)</b>(?:</a>|</b>)

の部分が名前欄になぜちゃんとマッチするのかってのは実は結構難しいんです。
<b>(.+)</b> としているので最長一致となるので</font>の直前の</b>までマッチしてしまって
結果おかしくなってしまいそうな気がするんですけど、実際には (?:</a>|</b>) があるおかげで
最長の一個前でうまくマッチしてくれているのがなんか不思議だなと・・・
(それぞれの</b>をどう識別してるんだろうと思いませんか?)

まあ正規表現だけを解説した本とかあるくらいですし奥が深いですね。

99 ◆/vmukiyuzw :2007/10/10(水) 00:46:44
http://pc11.2ch.net/test/read.cgi/software/1191771015/50-51
この50さんはいろんなブラウザスレに同じこと書き込んでことごとく無視されてるようですがw
AND表現で検索というのは正規表現でも結構難しいものがあるみたいです。

例えばある文字列を「A or B」で検索するアルゴリズムを考えてみます(正規表現では(A|B)ですか)。
文字列をスキャンしていき、「A」または「B」にたどりつけばそこで検索終了です。特に難しいことはないでしょう。
が、「A and B」になるとどうでしょう。
「A」にたどりついても次に「B」が存在するか最後(ってどこ?)まで検索しないと答えは出ないわけです。
(もちろん「B」を先に見つけても同様です)

で、正規表現でも先読みを使ってAND表現できないことはないのですが、結構面倒ですし
処理系によってはサポートされてない場合もあります。

正規表現以外の実現手段もあるかもしれませんがそれはなおいっそう面倒なことになるのは
間違いないでしょう。personal検索エンジンみたいな?

100 ◆/vmukiyuzw :2007/10/18(木) 00:51:37
個人的なメモをJaneから読み書きできるものが欲しいなと思って。

(そんなのテキストファイルでいいじゃんと思われるかもしれませんが
リンクをクリックしたら飛べたりポップアップしたりできるのはやはり便利かなと)

JaneWlita(自分専用の板を仮想的に作成し、指定したレスを仮想板にスクラップ(書き込み)したりするScript)
ってのがあるらしいので調べたんですが
DMonkeyていうスクリプトエンジンが必要らしいのですが
こいつが今やweb.archive.orgにしか残ってないような代物。
ググっても導入方法とかよくわからないので遠慮しとこうかなと。
(まあ実際にやってみれば難しくないのかもしれないですが)

次に考えたのがローカルにhttpサーバを立てることですが
それだけの目的のためにやるのは面倒臭いなと思ってやめ。

結局したらばに隠し板作ることにしました。
非公開にして自分しか書き込みできないように設定して。
# まあ見ようとすれば見ることは可能なのですが
# 意味不明なことしか書いてないので問題ないかと^^;


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

■ したらば のおすすめアイテム ■

ふともも写真館 制服写真部 - ゆりあ


この欄のアイテムは掲示板管理メニューから自由に変更可能です。


掲示板管理者へ連絡 無料レンタル掲示板