テストその２ - 1038409548 - したらば掲示板

1：名無しさん：2002/11/28(木) 00:05: テストその２
37： ◆/vmukiyuzw：2005/10/26(水) 02:12:39: 文字コードの自動判別を実装すべく研究中。
HTTPでの文字コードの指定方法としては
1.MIMEヘッダの中でcharsetパラメタを用いて情報を指定する方法
2.HTML文書の中でMETAタグを用いて情報を指定する方法
の2通りがあって、RFC的には1.が本来あるべき方法であり、2.はあくまで
補助的なものであるらしい。

・・・けど、（少なくともhtmltodatでは）実用上は2.だけ気にしてればいいような
気がする。1.と2.が食い違っていて問題になるようなケースに出くわしたことが
無いだけかもしれないけど。
ファイルに保存したHTMLだとどのみち2.しか使えないというのもあるし。
38： ◆/vmukiyuzw：2005/11/01(火) 21:56:44: ぐぐっていたらこんなブログ見つけた。
ttp://d.hatena.ne.jp/sskm/20051018
htmltodatサポスレに書いてくれたら一発で解決しそうなのに・・・
（とコメント書こうとしたけどユーザー登録しないとコメント書けないみたいなんで
面倒なんでやめたんですが）
39： ◆/vmukiyuzw：2005/11/13(日) 00:31:42: 修正するにはしたけどテストするのが面倒くさい・・・
（とプログラマとしては最低のセリフを吐いてみたりする）
ドキュメント修正するのも面倒だし・・・
ちょい体調がイマイチなせいでモチベーションも下降気味です
40： ◆/vmukiyuzw：2005/11/18(金) 01:20:21: test
41： ◆/vmukiyuzw：2005/11/19(土) 01:40:49: この板を作った経緯等についてちょっとメモっときます。

昔、JaneがまだJBBSやまちBBSに対応してなかった頃、ソースは公開されていた
ものの、当時はdelphiで弄って対応できる自信がなかったので、仕事で使っていた
Javaでプロキシソフトを作成して読み書きできないか実験していました。
その実験のために作ったのがこの板です。
（その痕跡が過去ログの「テストその１」スレに残ってます。SJISの機種依存文字を
EUCに変換できるか試していたものです）

で、何とかそれなりの形にはなったのですが、もたもたしてる間にJaneも進化して
JBBS等にも対応してしまったので、世に出す機会がなくなりました。
（あくまで実験用だったので設定とかが難解で実用的じゃなかったのもありますが）
でもそのソフトでも正規表現でdat変換とかやっていたので、これだけでも取り出して
単独のソフトにしてみたら多少は使い道があるかも、と思って作ったのがhtmltodat
です。Janeのちょこっとした改造ならやったことあるのですが、一から作ったのは
delphiでは初めてだったりします（なので未だに初心者レベルなのです＾＾；

で、サポートスレが必要だなと思ったのですが、2chに立てるほどのニーズはないな
と思ったので、この板を流用しちゃおう、ということで現在に至ります。
42： ◆/vmukiyuzw：2005/11/21(月) 02:09:54: いまさらの話が続きますが、BREGEXP.DLLて勝手に配付していいのかな？
（フリーメールを読むためにJupiter 5てのを使ってるんですがBREGEXP.DLLが
同封されているのに最近気づきました）
作者のBaba氏に確認とか取らなきゃいけないのかな？
・・・でもよく考えてみるとASPを使ってるサイトなんてほぼ確実に使ってますよね。
次からhtmltodatに同封してもいいのかなとか思っています。
43： ◆/vmukiyuzw：2005/11/21(月) 02:25:33: >>42
・・・と書いてからBASP21のサイトを見に行ったら、FAQのページに
思いっきり再配付OKって書いてました・・・
次から同封するようにしますね。これでちょっとインストールの敷居が
低くなってくれると嬉しいんですが。
44： ◆/vmukiyuzw：2005/11/26(土) 22:24:45: メモ
m#<dt><a href.*?>([0-9]+)</a> ：(?:|<a href="mailto:(.*?)" class=mailto>)?(.*) (?:</a>|)? ：(.*?) <dd> *?(.*?) *? *?(<a name.*?>|</tl>|</dl>)#mi
45： ◆/vmukiyuzw：2005/12/03(土) 00:53:02: スレの１からdat名を割り出すモジュールはまあそれなりに出来たのですが
これを組み込むのが意外と細かいとこで面倒・・・
通常の変換と一括変換両方ありますしね。まあプログラミング的には簡単
なんでしょうけどあまり面白くはなくて気が向かない、て感じです。
まあ、今週末は予定があって時間が取れないですが来週中には何とか、
てところで。
46： ◆/vmukiyuzw：2005/12/11(日) 21:58:29: しかしまあ、subject.txt作成なんておまけに気まぐれでつけたような機能なのですが
使ってる方は結構いらっしゃるみたいですね＾＾；
readmeにも使用用途もろくに書いてないのに・・・
まあ作者としては有難いことではありますが。
47： ◆/vmukiyuzw：2005/12/31(土) 14:53:25: メインマシンが故障・・・（液晶バックライトが切れただけみたいですが）
仕方なくサブマシンを起動すると、長い間放置していたせいか、
セーフモードですら起動しない状態・・・やむを得ずOS再インストール。
必要最小限のファイルとアプリだけコピーしてやっと今に至ります。
まったく、大晦日だってのに何やってんだか・・・

で、サブマシンに開発環境を構築するのも難儀なので、修理に出して
返ってくるまで（２週間くらい？）何も手出しできない状態となると
思います。あしからず。
48： ◆/vmukiyuzw：2006/01/03(火) 23:42:48: 帰省より復帰。
うちの実家の正月は、がめ煮（一般的には筑前煮と呼ぶものです）を
大量に作る習慣で、美味しいです。いっぱい食べてきました。
甥っ子（５歳）とプロレスごっこで遊んで、意外と強いので汗をかきましたｗ
あと、任天堂DSで脳年齢チェックしました。62歳でした・・・orz

・・・まあそんなことはさておき、結局「2006/01/01 08:59:60」が表示された
スレは存在したのでしょうか？
今更ながらググってみたら
http://qb5.2ch.net/test/read.cgi/operate/1121886018/674
みたいなレスを見かけたんで、多分なかっただろうと思うのですが。
（イタズラのためだけにbbs.cgiを弄るにはかなりデリケートな部分ですし）
49： ◆/vmukiyuzw：2006/01/05(木) 21:54:32: 659さんの掲示板
http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1116159529/417
で紹介されていたウィンドウズデベロッパーマガジンを買ってきました。

正直、UTF-8についてはあまり詳しくは知らなかったので、勉強になりました。
文字コード自動判定のVB版コードが載っていましたが、delphiに翻訳するのも
そんなに難しくはなさそうなので、htmltodatに組み込んでみようかなとか
思ってます。今は>>47の通り開発環境が手元にないので何もできないですが。

# しかし、システム屋の最前線から離れてサンデープログラマになってから
# しばらく経つのですが、知らないキーワードがいっぱいで参りました・・・。
# Oracleも10gとか出てるし（てかgが何の略なのかわからない
50： ◆/vmukiyuzw：2006/01/07(土) 19:04:05: http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/437
本家であることを主張しておかないとと思ったので。

・・・というのは冗談で、なんか厨房臭くて恥ずかしいなと思うように
なってきた、というのが理由です。
# 話は飛びますが同様の理由でえまのんのUIとか嫌いです。
# Janeのトレース画面もちょっとだけ嫌です。
51： ◆/vmukiyuzw：2006/01/10(火) 01:18:31: うーむ、直レスするには多少差し障りがある内容を含んでるかなと思ったので
ここでこっそり書いたつもりなのですが、しっかりチェックされてますね＾＾；
# 659さんのレスは正直言うと意味がわからなかったですが

htmltodatも初期のバージョンではエラーメッセージとかかなり厨房臭かったです。
（使ってくれる人がそんなにいるとは想定してなかったので）
v0.1.0(2003/04/21)「エラーメッセージ等微修正」のあたりでかなり直した記憶が
あります。
「のようなもの」については、正直ついてることさえ忘れていて、
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/218
のレスで気づいてそのうち取ろうと思っていました。
まあ未だにあまり洗練されたUIとは決して言えないので、他アプリのUIをどうこう
言える立場ではないなと多少反省している次第です。今年は多少は向上できたら
いいなと思ってはいるのですが。

# おまけ・・・私の作ったソフトでバージョン毎のダウンロード数が一番多いのは
# 実はJaneLogMover0.0.3である。これってトリビアになりませんか？（なるかよｗ
52： ◆/vmukiyuzw：2006/01/10(火) 02:08:24: >>51書いてから気づいた・・・JaneLogMoverにも「のようなもの」付けちゃってる.。
でもこっちは特にバージョンアップの要望とか予定とかないしなあ・・・
バージョン変えずに「のようなもの」だけ取るのもありかも知れませんが。
53： ◆/vmukiyuzw：2006/01/17(火) 23:28:50: http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1116159529/512
そういうことではないと思います。プレビュー欄はIEコンポ使ってるのでコピペも
ソースの表示とかも出来ますし。

・・・しかしヒントにはなりました。
元HTMLとプレビュー欄のHTMLの両方を適当なエディタ（できれば正規表現が
使えるもの）でソース表示して、不要な部分を削除して、コンペア（これも大概の
エディタではできるはず）すればいいのではないかと。
まあ面倒っちゃ面倒かもしれませんが。
54： ◆/vmukiyuzw：2006/01/24(火) 02:11:10: 229.167.150.220.ap.yournet.ne.jp アク禁にしました。（って見ちゃいないでしょーけど）
55： ◆/vmukiyuzw：2006/01/24(火) 02:20:46: 理由書き忘れた。
業者スレ立てを繰り返しているので。

ついでに、この板の新規スレ立て自体、現状では不要かなと思うのでとりあえず停止しました。
必要があるなら（ないと思いますが）ここでご連絡を。
56： ◆/vmukiyuzw：2006/02/04(土) 21:05:59: http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/479
自分では「ctrl+v」以外使うことはまずないので全然気づきませんでした。
で、質問してみたのですが
http://pc8.2ch.net/test/read.cgi/tech/1138370150/114-115
自力で実装するしかないようです。
まあサンプルは見つけたのでぼちぼちとやります。
57： ◆/vmukiyuzw：2006/03/04(土) 23:04:51: たまたま見つけたのですが
ttp://kataemariwe25.dw.land.to/test/read.cgi/daddycool/1119634579/
の562,570
この頃には「read.cgi7.00？」に若干の不具合があったのでその影響ですかね
まあ半年以上も前の話なのでどうしようもないんですが
58： ◆/vmukiyuzw：2006/03/30(木) 00:54:00: 663さんのミラー変換機がネトランに載ったそうで（おめでとうです）
それはいい事なんですが跳ね返りでここに厨房が沸いてこないか不安です（自意識過剰かな）
対処できる自信がないので・・・
59： ◆/vmukiyuzw：2006/04/08(土) 00:13:04: htmltodatが簡易ブラクラチェッカーとして使えることに気づいて
そういう使い方がメインな今日この頃ｗ ←てかさっさと更新しろよ
60： ◆/vmukiyuzw：2006/04/18(火) 01:52:39: http://pc7.2ch.net/test/read.cgi/software/1143611320/360-362
やっぱ見た目ごちゃごちゃしてると言われるのは仕方ないです・・・
メニューバーを付けて使用頻度の少ないものをまとめればばもう少し
整理できそうな気もするんですがそれはそれでアクションが増えて
しまいそうのでどうしたもんかってのが考えどころです。
61： ◆/vmukiyuzw：2006/05/28(日) 02:49:42: htmltodatの前処理wコマンドの拡張についてですが・・・
もともと単に前処理のデバッグ機能的に付けようと思ったのですが、前処理を付けてしまった（？）た副作用で
いろいろできるようになったんで、ストリームエディタ的な使い方が出来てもそれはそれで面白いかなと思ったので・・・

で、こういうことになってしまった次第です。ほんと気まぐれで、本来のhtmltodatの用途とはほとんど関係ないです。
が、こういう用途にも使ってもらえるとそれはそれでいいかなと（て使いたいという人がいるのかという気がしますが）
て感じです。
62： ◆/vmukiyuzw：2006/05/28(日) 22:23:11: なんか最近業者がよく来るのでしたらばのカテゴリーに公開しないようにしました。
（そこから検索して来るお客さんはほとんどいないと思うので）
でもしたらばのカテゴリ名は数字の連番（うちの板は1929）なんで番号をたどって
来るような人には対処のしようがないです。あーうっとうしい・・・
63： ◆/vmukiyuzw：2006/07/10(月) 00:13:58: http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1116159529/792

まあ正直言ってしまうと、別に具体的なURLが知りたいという意図ではなく
「調べればわかるだろうけどお前の態度が気に入らない」ってとこですかね
まあ基本的には人間小さい奴ですから
64： ◆/vmukiyuzw：2006/07/10(月) 00:53:02: 誤解を招かないように一応
> お前の態度が気に入らない」ってとこですかね
もちろん659さんのことではなく332の人のことです
とはいえちょいと言いすぎかなと若干反省。
65： ◆/vmukiyuzw：2006/07/16(日) 21:23:52: http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/705,707
proxomitron以外でもHTTPヘッダを見られるツールはありますが
とりあえず一番メジャーかなと思って名前を挙げただけです
個人的にはヘッダと内容を両方モニタできる某ツールを併用してます

HTTPヘッダの情報なんて、自分で通信アプリを作ろうとか
いう人以外にはほとんど意味の無いものかも知れませんが
一応詳細は以下など
http://www.studyinghttp.net/cgi-bin/rfc.cgi?2616
66： ◆/vmukiyuzw：2006/07/22(土) 01:19:40: http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/712

>> てかいっそxyzzyでhtmltodat的処理を書いてしまうというのはどうでしょう？
> ここここれはわわわ私に言っててるのですすかかか

そうです。まあお時間があればでいいですがｗ
というか自分的にはhtmltodatはなるべく汎用性を目指したいと思って作ってきた
つもりですが、そこにこだわらなければどんなツールでもhtml→dat変換は出来る
はずなんです。別に正規表現とかも必須では無いですし。
なので、他に手段があるのであればそれでやればいいじゃないのという考えです。
67： ◆/vmukiyuzw：2006/08/29(火) 00:46:39: http://yy14.kakiko.com/test/read.cgi/mirror/1114936246/757-758
以下ほとんど独り言なのでこちらに書きます

> s#<a href="read.php?host=[^>]+?>(\d+)</a>#$1#g
「[^>]+?>」は多分単に「.+?>」でいけるはずです

何故こんな細かいとこに言及するかというと、まあsedやawkしかない
時代から正規表現と付き合ってきたというのがあって、perlの正規表現
（という言い方も正確なのかどうかわからない。正規表現の種類にバージョン
番号とかあればいいんですが）にはsedやawkにはない最短一致というのが
あるというのを知って、これは便利だと思ったわけです。
（昔の正規表現には最長一致しかなかった）
# ちなみに、最長一致というのは文字列を検索していってマッチする一番遠い
# ところを探す、最短一致は逆に一番近いところを探す、てな意味です

何が便利かって、まさにHTML文書を検索するようなケースで、HTMLってのは
基本的にはタグが「<」と「>」のペアで出てくるので、「<」が出てきたら次の「>」
までを検索したいケースが多いと思うのです。でも正規表現のデフォルトだと
最長一致になってしまうので、まさに上で書いたような「[^>]*>」（意味的には
一番近い「>」を探す）みたいな書き方を多用せざるを得なくなるのです。
そういう意味で最短一致「.*?」とか「.+?」みたいな書き方が出来るのは非常に
便利だしわかりやすくもあるので使える局面なら是非使うべきだと思うわけです。
68： ◆/vmukiyuzw：2006/08/30(水) 01:58:11: たまにはどうでもいい話題など・・・

今日、エアコンからいきなりポタポタ水が漏れてきたのです。
「やばい、故障か？」と思ったのですが、とりあえず2chの
家電製品板に行くと、見事にエアコン修理に関するスレが
あったのです。
そこを見てなんかいろいろやってみたらとりあえず直ったような・・・
まあまだわからないので修理を呼ばないといけないかもですが
とりあえずにでもすぐに情報が得られて対処できたのは
便利な時代になったもんだな～と思った次第です
69： ◆/vmukiyuzw：2006/10/28(土) 03:58:16: 数日前からVIP板の投稿日が

　佐賀暦2006年,2006/10/27(佐賀県と汚職) 19:43:23.16

みたいなことになっちゃってるので、
htmltodatの「レス１の投稿日時からdatファイル名を取得する機能」に影響がないか一応確認。

実はこの投稿日時を抜き出す処理自体、内部的には正規表現を使っていて、

　m#^.*?(\d*/\d*/\d*).*? *(\d*:\d*(:\d*)?)#

こんなパターンでマッチさせてたりします。
で、２回出てくる .*? が佐賀うんぬんの部分にマッチしてくれるため、問題は発生しませんでした。

ところで、影響うけてるものもあるようで。
http://jane.s28.xrea.com/test/read.cgi/bbs/1160222864/385,388

Jane Styleには「n日以内の新着レスからXX個までの画像を自動で開く」という機能があるのですが
「n日以内の～」の判定は投稿日時欄を見るしかないと思うので、多分佐賀暦に邪魔されてるのかなと。
ってhtmltodatでも 2006/03/32 でやられましたし他人事には思えなかったりします。
70： ◆/vmukiyuzw：2006/10/28(土) 04:27:08: ところで、>>69の確認をしてるときに気づいたことが。

VIPの適当なスレのHTMLを取得しようとしたのですが普通のブラウザでは「人大杉」になってしまうので
Janeで取得したdatをDAT2HTMLでHTMLにしてソースにしました。
当然正規表現は「DAT2HTML0.26」を選ぶべきところなのですが何故か勘違いして「read.cgi7.00？」を選択。
あれ？なんとこれでも正常に変換できるではないですか。

過去ログ追いかけてみるとv0.7.1のときに「read.cgi7.00？」を修正して差し替えてました。
このときの修正で結果的に「DAT2HTML0.26」を包含する形になったようです。
研究すればもっと汎用的なパターンができるかも。
71： ◆/vmukiyuzw：2006/11/04(土) 00:32:32: 勉強を兼ねつつ、いろいろ調べごとを重ねる日々。
新たに得る知識は結構あるけれども、実戦(?)にはなかなか至らない。
わからないことを調べていると途中でまたわからないことに出会い、
どんどん枝分かれしていく。収束する時は来るのだろうか。

・・・ともあれ、それらの枝の一つで興味深いものを見つけたのでメモっときます。

「鬼車」という、かなり高機能らしい正規表現ライブラリがあるのですが、
それをラッピングして、かつbregexp.dll互換の機能を実装したライブラリを作った方がおられます。
ttp://homepage3.nifty.com/k-takata/mysoft/bregonig.html

この bregonig.dll を htmltodat.exe と同じフォルダに持ってきて、名前を bregexp.dll にリネーム
（もちろんオリジナルは退避した後で）すると、それだけで使えます。
本家ではサポートされていない、より新しいバージョンの正規表現機能が使えるのみならず、
パフォーマンスも良さげ？なので、しばらく試用してみようかなと思っています。

# しかし、ラップ元の「鬼車」は各種文字コードに対応しているのに、
# 「bregonig.dll は Bregexp.dll との互換性のため、ASCII と Shift_JIS 以
# 外の文字エンコーディングは使用できません。」
# だそうです。ちょっと残念。
72： ◆/vmukiyuzw：2006/11/06(月) 22:46:50: http://yy14.kakiko.com/test/read.cgi/mirror/1158402994/85

LISPを使ったものではなくあくまで手動ですが、xyzzyの正規表現置換機能で
UTF-8のHTMLをdatに変換してみました。
対象にしたスレは http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/336 に上げて頂いた
http://web.archive.org/web/20030425012552/world2ch.net/test/read.cgi/accuse/1048754153/1-100 です。

検索:
<dt>$[0-9]+$.*?$?:<a href="mailto:\(.*?$">\)?$.*$$?:\|</a>$: $.*?$</dt> <dd>$.*$ </dd>
置換:
\3<>\2<>\4<>\5<>

スレの前後の不要な部分は手動で取り除き、スレタイはレス１の最後に手動で付加すると。

…ところで、これをJaneNidaで正常に読ませるにはどうしたらいいんでしょうか…
適当なフォルダにおいて読ませるだけではSJIS扱いされて文字化けしちゃうんですが。
73： ◆/vmukiyuzw：2006/11/06(月) 23:02:22: ところでこれは>>66で書いたように「どんなツールでもできるはず」をふとやってみようと思っただけです。
結局（楽なので）正規表現使っちゃいましたが＾＾；

ちなみにxyzzyで使える正規表現はこちら
ttp://xyzzy.s53.xrea.com/reference/wiki.cgi?p=%C0%B5%B5%AC%C9%BD%B8%BD%A4%CE%C9%BD%B5%AD
を参考にしました。
基本はhtmltodatでやってることと変わらないのですが、使える表現が微妙に異なり
括弧とかの前にいちいち\を付けないといけないのが面倒かなと思いました。
74：名無しさん：2006/11/09(木) 00:03:45: NidaはWorld2chの対応ロジックは消しちゃったんじゃないかな
JaneでUTFの多言語表示に対応しようと思ったらSjisじゃなくて
Unicode表示にしないと意味無からねぇ
75： ◆/vmukiyuzw：2006/11/09(木) 01:37:36: >>74
うむ、確かにJaneNida.txtにもそのようなことが書いてありますね（Nida040916）
これ以前のバージョンが手に入らないかなあとNidaのサイト見てみましたが
過去バージョンは置いてなさげ。

仕方ないかとあきらめかけたのですが、ふと思いついて
xyzzyの2ch-modeを試してみたところ、読めてしまったような…！
これぞ灯台下暗し？

今日はもう遅いので詳細は後日にでも。
76： ◆/vmukiyuzw：2006/11/10(金) 22:03:52: >>75の続き

>>72の方法で変換したdatを2ch-mode配下の適当なログフォルダに置いて
読ませてみました。
文字自体は日本語もハングルも化けずに一応表示できました。
自動で文字コード識別してくれるのですね。やっぱxyzzyは基本からよくできてる。

が、一つ別の問題が。
アンカータグ（<a href=～>とか）の文字列がそのまま表示されてしまいます。
文字コードがUTF-8なこととは関係ないような気がするのですがよくわからない…
とりあえずアンカータグを取っ払うことにしました。
# 大抵の2ch専用ブラウザではアンカータグがなくても自動で補ってくれる機能がついているので。
# （ちなみにhtmltodatでもデフォルトではアンカータグを削除するようにしています）

いったん2ch-modeを終了してエディタモードでdatを開きなおし、<a href.*?> と　</a> を全て削除し、
上書き保存しました。
その後、2ch-modeを再起動してスレを読み込ませたところ、今度はほぼ上手くいってる模様。
# ハングル文字で書かれたレスに対するレスアンカーをポップアップさせると文字化けしてしまいますが
# まあそれくらいのことは気にしないことにしよう。作り手側が多分意図していない無理やりな使い方で
# たまたま上手く行ったようなものだし。
77： ◆/vmukiyuzw：2006/11/10(金) 22:33:41: ところでこれは、UTF-8のHTMLをUTF-8のdatに（SJISを介せず）変換し
それをUTF-8対応の2ch専用ブラウザで読めるかどうかの検証だったので、
目的としては一応うまくいったといえると思います。

で、この結果の上で、本家htmltodatとしては何をすべきか・・・？
（別に何もしなくてもいいのかもしれないですがｗ）
78： ◆/vmukiyuzw：2006/11/25(土) 00:53:46: ふと、かつてよく出入りしていたORACLEとかACCESSとかの掲示板に行ってみました。
コテハン使ってたし全文検索できる掲示板なので名前で検索してみました。

意外なほどたくさん書き込みしてて、我ながら凄いなと思うような書き込みも多々あったのですが、
凄すぎて何を書いてるのか理解できないものもかなり多いｗｗｗ

・・・いや笑ってる場合ではなく、これは自分の知能がリアルで低下してるのかなぁとｗ
そして今のこの掲示板に書いてることも近い未来には理解できなくなるのかもしれないと。
まあどうしようもないことかも知れないのですが、自分の成果物（？）をどういう形で残していくか
もしくは放置するか。少し考え込んでしまいました。
79： ◆/vmukiyuzw：2006/12/31(日) 00:57:16: 今年ももう終わりですねえ。

そういえば昨年末には>>47みたいなことがあったなあ・・・と思って
ふとサブマシンを起動してみるとまた壊れてる・・・もう笑うしかないです。
（レジストリファイルが壊れてるらしく認識できていない。セーフモードでは
一応起動できるもののそこから何も操作できない）
またOS再インストール。環境整えるのももう面倒なのでそのままです。

・・・しかし使い倒して壊れるのなら納得もいくのですが、使ってないのに
壊れるというのは何故なんでしょうね。
そういえば、VHSのビデオデッキを２台持っていたのですが
メインで使用していた方がテープの巻き込みをするようになってしまい
仕方なくサブ（ほとんど使ってなかった）を使おうとすると
やはりテープを巻き込んでしまい使い物にならない。
結局２台とも廃棄する羽目になってしまったということもありました。

で、ふと考えたのですが、今のメインマシンが壊れたらどうしようと。
いろいろとソフトを導入しているんで使えなくなったらとても困るなあ。
なので、外付けHDDとバックアップソフトの購入を検討中です。
来年早々にも買いに行こうかな。
80： ◆/vmukiyuzw：2007/01/03(水) 23:52:26: いまさらですがあけましておめでとうございます。
今年の抱負としては、なんか新しいソフトでも作ってみようかなあ。
でも何にもアイデアがうかばない＾＾；
やはり例年通りグダグダな年になってしまいそうです＾＾；
81： ◆/vmukiyuzw：2007/01/15(月) 22:33:42: さて、>>79でも書きましたが外付けHDDを買ってきました。
バッファローの250GB。おまけのソフトにAcronis True Imageが
ついてくるのが選択の決め手でした
（バックアップソフト比較スレ等で評判がよかったので）。

そんで早速バックアップ取ってみたのですが、時間かかるかかる。
30GBくらいのバックアップにほぼ10時間かかりました。
試しに100MBくらいのファイルを本体から外付けHDDに
単純にコピペしてみたところ、3分くらいかかりました。
30GB/100MB*3分/60だと15時間くらいになるので、やっぱ
外付けHDD（への転送）自体が遅いのかなあ。
ソフトに圧縮機能があり多少サイズは小さくなってるので
まだ10時間で収まった、とも言えるかも。

本体がもう５年くらい前に買ったノートPCなんで
接続はUSB1.1なんです。2.0だとどれくらい違うんだろうか。
82： ◆/vmukiyuzw：2007/01/17(水) 22:13:04: 調べてみるとUSB1.1というのはかなり遅いインターフェースのようで。
対応製品の仕様とか見てると「最大12Mbps」とか見かけます。
LANより遅いのね。まあ前世代のものなので仕方ないか。

これがUSB2.0だと「最大480Mbps」とかになるようで。40倍ですね。
USB2.0インターフェイスPCカードが手軽な値段であるので買おうかな。
83： ◆/vmukiyuzw：2007/01/24(水) 21:37:54: USB2.0インターフェースPCカード買いました。
早速バックアップ取ってみると・・・1時間弱てとこでしょうか。
40倍とはいきませんでしたが、まあこれならまだ実用に
耐えるかなという感じです。
CD-ROMからのブートでもちゃんと外付けHDDを認識しました。

これでいつ壊れても安心。ってなるべくならそんな日は
来ないほうがいいのですが。
84： ◆/vmukiyuzw：2007/02/08(木) 00:25:53: たまたま見つけたんですが
ttp://nanabit.net/python/html2dat.html

htmltodatでいうと「read.cgi7.00？」相当の変換ができるようです。
しかしActivePythonインストールが必要、かつコマンドプロンプトでの
実行が必要みたいで。

自分的にはもともとこういうスクリプトでやってたことをUIをかぶせれば
もう少し使える範囲が広がるかなと思って作ったって経緯もあるんで
方向性の違いかなていうことか。

まあhtmltodatも「正規表現とかわからん」とかいう意見が多いわけで
そういう方にはおすすめかもしれないです。
85： ◆/vmukiyuzw：2007/02/26(月) 21:06:20: http://yy14.kakiko.com/test/read.cgi/mirror/1158402994/526

私も試して見ましたが問題なく変換できますね。

まあ推測に過ぎませんが
http://ex20.2ch.net/test/read.cgi/gline/1165651379/638 さんは
単純に手順の間違いじゃないですかねー
前処理を貼り付けるのを飛ばしてるとかそんな感じがします。

あと
http://ex20.2ch.net/test/read.cgi/gline/1165651379/640 （659さん）は
「全部」のURLでやっていないだけのように思えます。
「その９」のデフォルト表示では全レス表示されてないようなので。
86： ◆/vmukiyuzw：2007/03/03(土) 20:54:55: くだらないことですが。
最近、
「ご教授ください」
「×ご教授
　○ご教示」
「ご教授でも間違いではないよ」
みたいなやりとりをよく見かけるような気がして、調べて見ました。

------------------------------------------------------------------------
大辞林第二版（三省堂）

きょうじゅ　けう― 【教授】<

（名）スル

(1) 0 1 (ア)児童・生徒に知識・技能を与え、そこからさらに知識への興味を呼び起こすこと。

(イ)専門的な学問・技芸を教えること。
「国文学を―する」「書道―」

(2) 0 大学などの高等教育機関において、専門の学問・技能を教え、また自らは研究に従事する人の職名。助教授・講師の上位。
------------------------------------------------------------------------

確かに間違いではないように思えますね。
87： ◆/vmukiyuzw：2007/03/13(火) 23:58:38: いきなり言っちゃいますが、正規表現というのは危険です＾＾；

解析するエンジンと実際に書かれる表現とそれにマッチさせる文字列の
組み合わせにもよりますが、書きようによってはスタック領域（って何？まあプログラムが
使うメモリ領域の一部と理解してください）を食いつぶして自爆するようなことが
簡単にできたりします。
以前、bregexp.dllが「fatal error」を起すのはバグじゃないかみたいな書き方をしたことが
あるのですが、そうではなくおそらく上記制限に引っかかって起こる現象ではないかと
今は思います。

そういう危ないものをユーザが自由に指定できるようなソフトを公開していること自体
いかがなものかと思われるかもしれないですが、現実にはそういうソフトは世の中に
山ほどありますし（テキストエディタとか大抵できますしね）
まあ「気をつけたほうがいいですよ」ぐらいしか言えないです。

で、だらだらと書いて結局何を言いたいかと言うと、
「エンジンを新しいものにすれば不具合は解消される可能性がある」
ってことで。具体的には>>71で書いたものなんですが。
興味のある方には使ってみていただきたいなあと思う次第です。
88： ◆/vmukiyuzw：2007/03/18(日) 03:40:12: なんかちょっとPCのキーボードの調子が悪いです
また修理に出さないといけないかも・・・
そうなるとメンテナンスとかバージョンアップとかしばらく無理なので
ご容赦ください。
89： ◆/vmukiyuzw：2007/03/21(水) 00:02:01: http://www2.pf-x.net/~soft186/kako/index.html
こんなソフトウェア板の過去ログ保存サイトを見つけたんですが
（http://mukiyu.hp.infoseek.co.jp/をリンクしていただいてるので）
こんなスレがありまして。

■こんなソフトウェアってありますか？～Part46～■
http://www2.pf-x.net/~soft186/kako/1073664639.html

以下適当に引用。
-----------------------------------------------------------
15 名前：名無しさん＠お腹いっぱい。：04/01/10 12:35 ID:nzs4W2Ci
htmlからdatに変換できるツールないですか？

24 名前：名無しさん＠お腹いっぱい。：04/01/10 13:21 ID:nX+R5d+/
>22
検索して10秒で見つかる
http://mukiyu.hp.infoseek.co.jp/

27 名前：名無しさん＠お腹いっぱい。：04/01/10 13:24 ID:nzs4W2Ci
>>24
あ、それなんか無理だった。
なんか、2chとまちBのhtmlをdatに変換したいんだけど、
正規表現？が二つともなかったから出来なかった。

29 名前：名無しさん＠お腹いっぱい。：04/01/10 13:27 ID:nX+R5d+/
>27
多分死ねばいいと思います。
2ちゃんと町BBSは別物だし。

htmltodatのようなもの Ver 0.1.4 Copyright(C) 2002-2003 by mukiyu
【概要】
2ch形式のHTMLをdat形式に変換するソフトです。

30 名前：名無しさん＠お腹いっぱい。：04/01/10 13:28 ID:nzs4W2Ci
>>29
でも、正規表現にまちBが入ってますが？

31 名前：名無しさん＠お腹いっぱい。：04/01/10 13:29 ID:nX+R5d+/
>30
ヽ(´ー｀)ノ　もうお手上げです
これ以上おいらをいじめないで下さい
--------------------------------------------------------------

そういえばまちBBSの正規表現なんて、JaneでまだまちBBSがサポートされてなかった
頃以来使ったことがないし、htmltodatサポートスレにも質問来たこともないし、
いつのまにかHTMLの形式が変わったんでしょうか・・・
と思っていくつか試してみたら、今でも特に問題なく変換できるではないですか。

どこが無理だったのか、もはや３年以上も前のレスなので知るすべもないですが
こういうのはたまたま見つけてしまうとなんとも気になってしまうものです。
90： ◆/vmukiyuzw：2007/04/12(木) 00:47:31: http://pc11.2ch.net/test/read.cgi/software/1169819680/777

Jane自体にはdatを書き換えるような機能はないですし、
htmltodatも結局は特定目的のテキスト編集加工ツールなので
その意味内容を解釈して加工するようなことはできないですね。
（2000年以降限定で年の前に'20'をつけるくらいはできるでしょうが）

自分がやるならexcelに読ませて加工して書き戻すとかですかね
年の4桁表示は書式で何とかなりそうですし、曜日の表示は
関数を応用すればこれも何とかなりそうですし。

・・・で具体的な手順は、と問われると面倒そうなのでレスは避けたんですが。
91： ◆/vmukiyuzw：2007/04/23(月) 02:03:50: 前に書いたような気がしますが、フリーメールの送受信に
Jupiter5っていうソフトを使っています。
これは、フリーメール（大抵はwebメールですね）を普通のメーラーで
送受信できるようにしてくれる、ある種プロキシ的な動作をするソフトで、
結構便利なものです。

なんでこのソフトの話をするかというと、webメールの送受信をするために
そのサイトに対応するスクリプトを指定する方式になっているので、
その点でhtmltodatとちょっと似てるなと前から思っていたのです。
Jupiter5のほうが作られたのは先ですしJavaScriptで指定する方式ですし
全然違うじゃんと思われるかもしれませんが、発想が似てるかもって。
（真似したわけではありませんです）

で、今日たまたまinfoseekのメールを読むのにログインエラーになって
しまったので、ちょっとサポート掲示板を見に行ったところ解決したのですが
（タイトルの「infoseek」を「Infoseek」に変えたのでヒットしなくなった）
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/461
と同様な苦労を感じてなんか切なくなった、ということで書いた次第です。

参照されてる可能性があるものを気分次第（？）で変えて欲しくないなあ
と思うのは少数派の参照する側のわがままかも知れませんけど。
92： ◆/vmukiyuzw：2007/05/20(日) 22:03:57: http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1164941934/249-250
FATとかの単語を使っていて思い出したのですが。

まだ昭和の時代に書かれた、「MS-DOSとは何か」という本を持ってるのですが
（著者はコンピュータ関連の本を沢山書かれてる脇英世さんという学者さんです）
講談社ブルーバックスの、当時たった620円の本なのですがこれがとんでもなく
内容が濃い本でして・・・
パソコンの歴史に始まり、OSとはなにかと言う解説を語った後、MS-DOSの仕組みを
メモリ構造の具体的な図解やダンプリストなど交えながら詳細に記述してある
本で、もちろんFATの構造についても詳しく書いてあります。
ものすごく勉強になりましたし、今読んでも参考になる部分があります。

・・・で思ったのは、たかだか250ページくらいの本で基本的なことを学べる時代に
遭遇できていたのはある意味ラッキーだったかもって。
今のWindows等で同等のレベルの本を書こうと思うと多分とんでもない量に
なっちゃうんじゃないでしょうか。今から基礎をやろうと思う人は大変だろうなと思うわけです。
93： ◆/vmukiyuzw：2007/05/28(月) 00:52:09: http://yy14.kakiko.com/test/read.cgi/mirror/1158402994/732

> 【検索】姪
> http://wannabe.fam.cx/service/2ch_01/search.cgi?str=%CC%C5

で検索してみると引っかかるスレタイは例えば
「路面電車バカにするな」
「【あべし】「北斗の拳」がＭＭＯＲＰＧ化決定！【たわば】」

で、EUCのヘキサでみると「面電」→CC CC C5 C5
「北斗」→CB CC C5 CD
２バイト文字の２バイト目と次の文字の１バイト目で引っかかってるようです。
検索するプログラムのほうがマルチバイト文字を意識して作られてないと
こういうことになっちゃうんでしょうね。
さらに検索してる文字が一文字なのでこういうことになる可能性が
高まったとも思われます。

で、文字コードの観点から見ると・・・と書きかけたんですがすごい長文になって
しまいそうなのでやめときますｗ
94： ◆/vmukiyuzw：2007/05/29(火) 02:26:21: 唐突ですが、ふと気になってCD棚を探して見るとZARDのアルバムが
一枚だけ見つかったのです。
「揺れる想い」というタイトルで、もちろんタイトル曲とか「負けないで」とか
収録されてる奴です。
多分、「揺れる想い」という曲が好きだったんで買ったんだろうと思います。
昔のことであまり覚えてないですけど。

で久しぶりに聞きながら歌詞カードとか眺めてたんですが
「揺れる想い」も「負けないで」も織田哲郎さん作曲なのですね。
・・・とここでまた気になってCD棚を探しに行くと、織田哲郎さんが
他のアーティストに提供したいろんな曲をセルフカバーした
アルバムも見つかったりして。
（織田さんバージョンの「揺れる想い」も収録されています
あと坂井泉水さん作詞のDEENの「翼を広げて」とかもあります）
これもまた聞いてみたり。
と坂井泉水さんを追悼しながらいろいろ懐かしい世界にちょっと浸ってました。

・・・でさらに話は飛ぶのですが、織田哲郎さんの最近の仕事で
思い浮かぶのは、アニメきらりんレボリューションの月島きらり
（モー娘。の久住小春さん）のプロデュース。
でも、織田さんが月島きらりをセルフカバーするのだけはどうしても
想像がつかなくて、つい笑ってしまった次第で。
95： ◆/vmukiyuzw：2007/06/10(日) 02:18:48: バージョンアップに向けいろいろ下調べとかしてるとこだったんですが・・・
先日DVD・HDDレコーダーの電源を入れるといきなり
「ハードディスクの容量が少なくなっています」て警告メッセージが・・・
残したいものはDVDに焼いて、いらないものはそのまま消して、て整理しないといけないんですが
これが意外に時間がかかる。しばらくこれに時間を取られてしまいそうで。

まあ今までもそうだったんですがいつバーションアップするとかは
ほんとに気分次第なので、期待してる人もそんなにいないとは思うのですが
まあその通りで期待しないでくださいねて感じです。
96： ◆/vmukiyuzw：2007/06/17(日) 02:06:24: http://yy14.kakiko.com/test/read.cgi/mirror/1158402994/754
肯定先読みというのは、検索するアルゴリズムから見ると
「ヒットするものを見つけたから次へ行こう！」じゃなくて
ヒットしたものを見つけても元へ戻ってまた探す、みたいな感じなようですね。
これはオリジナルのbregexp.dllではサポートされていないですね。
鬼車バージョンではサポートされてますけど。

でもまあhtmltodat的には多分あまり必要性がないような気がします
というか基本的にそんなに難しい正規表現が必要なケースは
それほどないと思っています。

元のdatがhtmlにされる段階で改竄（といっては失礼か）されて
元に戻すことが困難になるケースはたびたびあると思いますが。
（にくちゃんねるとかはまさにそうでしたね）
97： ◆/vmukiyuzw：2007/07/05(木) 02:07:52: 詳細は省略しますが
http://pc11.2ch.net/test/read.cgi/software/1181762211/830
> ヴィスタ化は世の中の流れだと思いますが
> ＸＰはどうせ見放されます。それは確実です。

そうなんですかね？
私は知り合いに「逆にXPのPCが値割れしてるから今が買い時かも」
って勧めてしまったんですが。
XPは確か2011年までサポート継続されたそうですし逆にvistaは
2年ほどで次のバージョン出るそうですし。

それよりも言いたいのは、自分もフリーソフト作ってる立場として、
OSがバージョンアップされたからといって、それにあわせて
作者の環境も（ソフトもハードも）バージョンアップしなきゃ
いけないんでしょうか？ってことです。
もともとフリーだから趣味で作ってるのに、悪い言い方すれば
作者に「さっさと新環境揃えろよ」と言われてるようで、
でもそりゃ人それぞれ都合があるだろうと思うわけで
いかがなものかと思うわけです。
98： ◆/vmukiyuzw：2007/09/30(日) 02:20:26: http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/486

> m#<dt><a.*?>([0-9]+).+?(?:"mailto:(.+?)">)?(.+)(?:</a>|).*?：(.*?)<dd>(.*) #mi

さらっと書いちゃって、実際ちゃんと動作するのですが
（引用していいのかな）

<a name="a1"></a><dt><a href="menu:1">1</a> 名前：<a href="mailto:sage">僕ドザえもん</a> 投稿日：2006/04/11(火) 23:49:36 ID:36X3fpBJ0<dd> 魔方陣を書いて「出でよ悪魔」と叫べばおｋ 

<a name="a2"></a><dt><a href="menu:2">2</a> 名前：酋長 ◆occulTjdPc 投稿日：2006/04/11(火) 23:50:29 ID:5fhQaGfM0<dd> 酋長が召還された 

に対して

(.+)(?:</a>|)

の部分が名前欄になぜちゃんとマッチするのかってのは実は結構難しいんです。
(.+) としているので最長一致となるのでの直前のまでマッチしてしまって
結果おかしくなってしまいそうな気がするんですけど、実際には (?:</a>|) があるおかげで
最長の一個前でうまくマッチしてくれているのがなんか不思議だなと・・・
（それぞれのをどう識別してるんだろうと思いませんか？）

まあ正規表現だけを解説した本とかあるくらいですし奥が深いですね。
99： ◆/vmukiyuzw：2007/10/10(水) 00:46:44: http://pc11.2ch.net/test/read.cgi/software/1191771015/50-51
この50さんはいろんなブラウザスレに同じこと書き込んでことごとく無視されてるようですがｗ
AND表現で検索というのは正規表現でも結構難しいものがあるみたいです。

例えばある文字列を「A or B」で検索するアルゴリズムを考えてみます（正規表現では(A|B)ですか）。
文字列をスキャンしていき、「A」または「B」にたどりつけばそこで検索終了です。特に難しいことはないでしょう。
が、「A and B」になるとどうでしょう。
「A」にたどりついても次に「B」が存在するか最後（ってどこ？）まで検索しないと答えは出ないわけです。
（もちろん「B」を先に見つけても同様です）

で、正規表現でも先読みを使ってAND表現できないことはないのですが、結構面倒ですし
処理系によってはサポートされてない場合もあります。

正規表現以外の実現手段もあるかもしれませんがそれはなおいっそう面倒なことになるのは
間違いないでしょう。personal検索エンジンみたいな？
100： ◆/vmukiyuzw：2007/10/18(木) 00:51:37: 個人的なメモをJaneから読み書きできるものが欲しいなと思って。

（そんなのテキストファイルでいいじゃんと思われるかもしれませんが
リンクをクリックしたら飛べたりポップアップしたりできるのはやはり便利かなと）

JaneWlita（自分専用の板を仮想的に作成し、指定したレスを仮想板にスクラップ（書き込み）したりするScript）
ってのがあるらしいので調べたんですが
DMonkeyていうスクリプトエンジンが必要らしいのですが
こいつが今やweb.archive.orgにしか残ってないような代物。
ググっても導入方法とかよくわからないので遠慮しとこうかなと。
（まあ実際にやってみれば難しくないのかもしれないですが）

次に考えたのがローカルにhttpサーバを立てることですが
それだけの目的のためにやるのは面倒臭いなと思ってやめ。

結局したらばに隠し板作ることにしました。
非公開にして自分しか書き込みできないように設定して。
# まあ見ようとすれば見ることは可能なのですが
# 意味不明なことしか書いてないので問題ないかと＾＾；
101：名無しさん：2007/10/20(土) 17:40:15: http://sourceforge.jp/projects/dmonkey/

http://jane.s28.xrea.com/test/read.cgi/bbs/1180559017/540
102： ◆/vmukiyuzw：2007/10/20(土) 23:05:19: >>101
レスありがとうございます
自分の調査不足でしたね

DMonkeyはかなり高機能っぽいんで使ってみたい気はあるので
時間があれば調べてみようかなと思います。
103： ◆/vmukiyuzw：2008/04/25(金) 20:38:11: http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1164941934/566

そんな大層なものではなくてよくある普通のアップローダでしたよ
jpgとかzipとかアップされてましたし

アップローダによっては拡張子に制限を付けてるとこもあるようですし
無難に.datにした、ってとこじゃないですかね
104： ◆/vmukiyuzw：2008/04/27(日) 01:22:11: http://pc11.2ch.net/test/read.cgi/software/1137821915/960

以前あった皇紀2665/4/1 とか 2006/3/32 みたいなのにはどう対応するのよと
つい思ってしまいますね。要望出すほうは「そんなこと知らね」ってとこでしょうが。

経験的に、そういう「そんなこと知らね」の部分というか、普段はあんまり発生しない
ケースに対応するのは意外にパワーをとられることが多いと思うんですよ。
人がやるかコンピュータがやるかどちらがいいかという話にもなるんだけど。
（これは単にコストパフォーマンスだけでも計れないから難しい）
105： ◆/vmukiyuzw：2008/04/28(月) 01:16:19: http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1164941934/568
私的にはそれほど困った事態だとは思っていないので
> こればっかりは、どうにもならないんだよなあ
とか言われても意味がわからないのです、いやマジ
ワットザマター？（いや別に答えなくてもいいですが）
106： ◆/vmukiyuzw：2008/05/04(日) 01:44:52: たまに暇なときに検索してみると面白いのが見つかりますね。

http://set.bbspink.com/test/read.cgi/erocomic/1033139947/811

bbspinkだとまた違うんだろうかと調べてみたんですが
正規表現「sample」で変換できるではないですか。

そもそも「sample」とか名乗りながらも本来はかつての2chの過去ログHTMLに
対応させたものなので、変換できても不思議はないです。
現在では過去ログHTML化が行われていないのであまり使いどころがないと
思っていたのですが、スレ番号が９桁だった頃のスレはまだHTMLで読めたり
するので、案外使い道はあるかもしれません。

# 引用元は半年以上も前のレスなので今更かかわる気はないですが
107： ◆/vmukiyuzw：2008/05/10(土) 00:52:01: PCのファン音がやたら大きくて振動もあるなあと気になっていたら、いきなり（青画面も経由せず）シャットダウン。
再起動しようとしてもスイッチONしてWindows起動したとたんに強制シャットダウン。
これは初めての経験だったので焦りました。

本体触ってみるとめっちゃ熱いんですよ。
熱暴走と言われるものかどうかわからないけど、とりあえず時間おいて充分さますと再起動できたので
なんとか温度が上がりすぎないよういろいろ工夫しながら使ってます。

まだ５月なのにこんなことで大丈夫か？この夏乗り切れるんでしょうか・・・
（って毎年思ってるような気もしますが）
108： ◆/vmukiyuzw：2008/05/10(土) 03:32:46: http://jbbs.livedoor.jp/bbs/read.cgi/computer/21256/1164941934/581
このスレもほぼ私の独り言なので気にしなくてOKです
一応htmltodat本スレにリンクされてレスされたのでなんか書いとかないといかんかなと思っただけです

# まあ逆にそういうレスは何らかの返しがある可能性があると思ってくださいｗ
109： ◆/vmukiyuzw：2008/06/07(土) 02:45:28: http://yy14.kakiko.com/test/read.cgi/mirror/1186175383/724-725
申し訳ないことをしました。本当にすみません。
いろんなスレを巡回しつつ実況もしてたら書き込む先を間違えました。
しかしこういうミスはソフトの機能で止めようがないですものね。
まったく自分の不注意としか言いようがありません。
110： ◆/vmukiyuzw：2008/06/23(月) 01:43:46: http://yy14.kakiko.com/test/read.cgi/mirror/1213700846/6
xyzzyは別にLispがわからなくとも十分使えるエディタだと思いますけど。

ところで、Lispで思い出したんですが、以前一緒に仕事した人で
話してると実はもともとLisp使いで、
（この時点で私は「リスパーっすか！かっけー」とか叫んでましたｗ）
しかもLispの解説書を執筆・出版したことがあるというなかなか凄い人でした。

で思ったのは、何でもいいけど本が書けるほどに精通できるものがあるのは
尊敬に値することだなと。
自分にはこんな掲示板で断片的な知識を散らばらせるくらいしかできないので。
# 「詳説・htmltodat」とかｗありえないですしｗ

ただ、本とまではいかなくても、最低限の解説文書みたいなものを書いてみたいと
いう気持ちは以前からあるんですけどね。
時間と文章力の不足で今のところ実現は難しいですが。
111： ◆/vmukiyuzw：2008/06/26(木) 02:03:51: PCのHomeキーが効かなくなってしまった・・・
多用するキーなので結構不便です。
たまたまWindows Updateしたタイミングで効かなくなったので
ソフト的バグが疑われなくもないのですが、やっぱハードの
障害の可能性が高いような気がします。
>>107の件もあるのでやっぱ修理に出したほうがいいかなあ・・・

ただ、サブマシンが死んでるのでなにもできなくなっちゃいますし
（いまさらサブのMe機を修理するのもなんだかなあと思うし）
思い切ってもう一台買っちゃおうかなあとか思ったり。
XPプリインストール機が今月一杯で買えなくなるというのもあるし
こないだ電器屋行ったら信じられないような安価のものも売ってたので
ちょっともう一回行って店員さんと話してみるかな。
112： ◆/vmukiyuzw：2008/06/27(金) 00:56:54: 買っちゃったあ＾＾；
XP機をすべりこみで入手しました。
まあvista機よりはスペックは当然落ちますがそれでも今のメイン機より上だし
なんせ安かったので（かつポイント会員のバースデイ割引が効いたりして）

しかしまあ今から自分専用マシン（？）に設定していくことを考えると、なかなか
大変だなあと思うと同時に少し楽しみでもあったり。
113：663 ◆fnwcOWFi56：2010/10/09(土) 10:55:45: いつもhtmltodatを利用させてもらっています。

iswebライトが10月末でサービス終了
http://isweb.www.infoseek.co.jp/info/information.html
との事なのですが、mukiyuさんは移転等考えられているでしょうか？

最近mukiyuさんの書き込みがないので、お元気かどうかがまず心配だったりしますが…。
114： ◆/vmukiyuzw：2010/10/09(土) 23:57:44: >>113
いつもお世話になります。

移転しないといけないのはもちろん認識してます。
ただ個人的に忙しい状態が続いていて時期的にはぎりぎりになるかもしれません。
気長にお待ちを。

健康状態は実は若干困った状況が一時期あったのですが＾＾；現在は元気ですので
ご安心ください。
115： ◆/vmukiyuzw：2011/01/18(火) 21:06:02: 最近BDレコーダーを買ったのでいろいろ遊んでるんですが、
前に買ったDVD機と比べると色んな点ですごく進化してるなあと感心する日々。
いろいろと驚くことがあったのですが一番驚いたのは、インターネット接続設定したら
携帯で外から番組表で予約録画ができてしまうこと。
IPアドレスを指定してるわけじゃないし、そもそもルータの内側にいるレコーダーに
FW飛び越えてどうやってアクセスできるのかさっぱりわからない。セキュリティホール
じゃないのか？（笑）
遊んでばかりで勉強不足を感じる今日この頃です。
116： ◆/vmukiyuzw：2011/01/18(火) 21:31:32: まあ冷静に考えてみると予約情報を記録するサーバーをレコーダーが定期的に
見に行ってるんでしょうね。
でも最初試したとき（放送中の番組を予約録画した）にほぼリアルタイムな感じで
録画されたのでどうなってるの？と思ってしまった次第です。
117： ◆/vmukiyuzw：2011/01/18(火) 23:18:46: レコーダーのついで、というわけでもないんですがルータも新たに買ったんですが
箱を開けた瞬間「ちっちゃ！！！なんだこれは」と声に出してしまいましたｗ
コレガの有線ルータなんですが26×86×138てサイズ。前に使ってたのがVHSテープと
ほぼ同じ大きさだったのでこの小ささは衝撃です。
レコーダーも小さくて軽くなってるし技術の進歩は凄いですねえ・・・
118： ◆/vmukiyuzw：2011/01/20(木) 23:50:44: PCでラジオ聞けるradikoってのがあるじゃないですか。
先日それで某放送聴きながら実況（笑）に参加してたんですが、
大阪在住だけど東京エリアの放送を聞いてると書き込みしたら
なんで聞けるの？とレスがあったんです。
で大阪も東京も両方聞けるよと返したんですが
「どこのプロバイダ？うらやましい」と返されたんですよ。

使い始めたときからできていたことなんで当たり前のことかと
思ってたんですがどうやらレアなことらしい。
あんまり言うとradiko側から規制される（？）らしいのでここでこっそり。
119： ◆/vmukiyuzw：2011/02/01(火) 18:38:28: http://jbbs.livedoor.jp/bbs/read.cgi/internet/8173/1292131235/696

試してみると確かに壊れますね。
datの中身を見てみると投稿日時欄がうまく拾えてないっぽい。
もしかして過去ログの形式が変更されたのかしら、とhtmltodatで
「jbbs過去ログ」を試してみるとこちらはうまくいきますね。
正規表現でわざわざ (?: 投稿日)?：とか書いてるとこをみると、
そもそも投稿日時欄の前に「投稿日：」と付く形式と単に「：」だけの形式の
両方が存在し、styleの場合（内部的なhtml→dat変換処理中で）
その一方にしか対応してないんではないかと推測。

ところでこのhtml、普通のブラウザでも専用ブラウザでも表示されないので
無視してもいいかもですが実はIDがHTMLコメントに隠されていますね。
もしこれを表示したいなら、前処理か後処理で

s##ID:$1#igk

とでもしてやればよいかも。
あと途中に透明あぼーんが大量にあるので「補う」チェックも必要ですね。
120： ◆/vmukiyuzw：2011/05/23(月) 02:18:14: 何もしてないわけではないんです
スキルと時間が足りない。時間は他の事に費やしちゃってる分が相当ありそうですが。
まあどのみちたいしたことは出来ないんですが、まあ少しずつ。
121： ◆/vmukiyuzw：2011/06/09(木) 00:32:53: 先日お料理をしようとしてて、ちょっと地中海風な料理で材料にオリーブが必要だったんで
スーパーに買いにいったんですが、「缶切り」が必要なタイプの缶詰のものしかなかったんです。

おい今時缶切りかよ！？と思いつつも、無いと空けられないんで100均で探して買ったのですが
自分の知ってる缶切りとは全然違うもので、なんか複雑な形状をしている。
最初使い方がよくわからず昔の缶切りのイメージでぐりぐりやってたんですがそれでは全然
切れなくて、使い方を読み直すと、（実物の画像とかないんで説明が難しいですが）
歯車に繋がるツマミをくるくる回すだけでガシガシ切れる仕組みになってて驚きました。

これはイイ！と思ったのですが、多分次に缶詰のオリーブが必要になるときまで使わないと思うので
使い方を忘れた時の覚え書きとして書いてみましたｗ
122： ◆/vmukiyuzw：2012/03/12(月) 01:02:12: ぎっくり腰になってしまいました・・・＾＾；
なんか腰の周りに違和感があるなーと数日前から思ってたんですが
なんかの拍子にピシッときました。

なった直後は歩くのもままならずどうしたもんかと思いましたが
一晩寝るとだいぶましになって歩くことくらいは出来るようになりました。
で家から一番近い鍼灸整骨院に行ったのですが、そこでの治療法は
足腰周りのストレッチが中心なんですがこれが泣くほど痛い；；
「足腰固いですねー」て不摂生が原因みたいな言われ方するんですが
普段そんなハードなストレッチしねーし！て感じです。
まあそんなひどい症状でもなく一週間もすれば治るだろうとの見込みですが。
123： ◆/vmukiyuzw：2012/03/18(日) 22:03:04: http://anago.2ch.net/test/read.cgi/software/1316551791/412

htmltodatはしたらばの現行スレでも変換できるんですがね。
まあ自分からあちこち手を広げようって気もあんまりないので静観です。
124： ◆/vmukiyuzw：2012/03/19(月) 02:39:59: >>123
に関してちょっと思いついたのでメモ。
したらばの現行スレの変換については
http://jbbs.livedoor.jp/bbs/read.cgi/computer/1929/1038588508/622
でもやってるのですが、普段あんまり使わないhtmltodatの機能を活用して
別のアプローチでやってみます。

受信オプション - URLの変換：
# したらばのURLをrawmodeに読み替える
s#(http://jbbs\.livedoor\.jp/bbs/)read\.cgi(/.*?/.*?/.*?/).*#$1rawmode.cgi$2#i

前処理：
# レス番号を切り飛ばす
s#(^|\n)\d+<>#$1#igk
# そのまま書き出し
w $SELECTFILE

「dat変換をしない（前処理のみ行う）」にチェック

前処理の段階でdatを書き出してしまうので正規表現以降は不要です。

したらばにはrawmode.cgiというdat形式に近い形式のデータを返すcgiが用意されてるので
まずこれを呼び出すようにURLを変換します。
（このURL変換機能は正直自分では使ったことなかった）

で返ってきたデータにはdat形式にはない余分なもの（レス番号）が付いてるので
これを前処理で切り飛ばします。
ここまでやるともう正しいdat形式になってるので、いつもの正規表現による変換はもう不要です。
前処理のwコマンドでそのまま書き出してしまいます。
（wコマンドも前処理の確認以外では使ったことなかった）

この手法は、dat形式もしくはそれに準ずるものを返してくれるサイトならしたらば以外でも使えそうです。
125： ◆/vmukiyuzw：2012/05/01(火) 23:11:59: 連休で久々に帰省したんですが途中何故か2回も人に尋ねられる状況に。

まず駅で切符買ってたら横の人に「○○駅までは△△円ですか？」と聞かれました。
言葉がちょっとたどたどしくておそらく海外からの旅行者の方ぽかったのでどういうふうに回答するか一瞬悩みました。

次に（別の駅ですが）時刻表を見てたら横で同じ時刻表見てた人に
「□□駅に行きたいんですが××駅で乗り換えるには電車の前のほうと後ろのほうどっちに乗ったほうが近いですか？」
と聞かれました。冷静に考えるとかなり難しい質問だったと思うのですが何故私がわかると思われたのだろう？
「ごめんなさいわかりません」と言うしかなかったです。

普段あまり見知らぬ人にものを尋ねられるようなことはないので、その日はたまたまなんか
尋ねやすい雰囲気をかもし出してたんでしょうかね。
126： ◆/vmukiyuzw：2012/10/19(金) 22:26:12: http://anago.2ch.net/test/read.cgi/software/1346851517/936

htmltodatだとできますけどあまり勧めたくない・・・ｗ
まあ頑張ってここまでたどり着いてくれることを祈ります。
127： ◆/vmukiyuzw：2012/11/15(木) 01:08:21: http://toro.2ch.net/test/read.cgi/win/1347196172/957,961-968

うーむ、微妙なところを突かれたような・・・
でもhtmltodat関連でぐぐると結構ヒットするんですよねこのページ。
なので何か出来るかもと思っちゃう人が現れても不思議ではなかった。

663さんが今さらこのスクリプトを積極的にサポートするとは考えにくいですし
かといって私のとこに持ってこられても困りますし・・・

以前考えてた「htmltodatをバッチコマンドで動かす」構想が形になってれば
まだ何とかなったかもしれないですが現在頓挫中ですし。
「GetLog.js見たいに、自動的にdatを読み込むように」をあきらめてくれれば
一手間かかりますがhtmltodatで何とかできると思うんですが。

（ログ速とかしょっちゅう形式が変わってそれに都度対応してるんで
どのみち完全自動は難しいとも考えられます）
128： ◆/vmukiyuzw：2012/11/15(木) 01:41:05: × 一手間かかりますがhtmltodatで何とかできると思うんですが。
○ 一手間かかりますが現在のhtmltodatでも何とかできると思うんですが。

まだ改良することを諦めているわけではないので一応。
129： ◆/vmukiyuzw：2012/11/16(金) 00:36:40: http://yy14.kakiko.com/test/read.cgi/mirror/1213700846/828

お疲れ様です。
なかなかいい感じですが結構な確率で誤動作しますね。
sendkeys の宿命かもしれませんが・・

> ・htmltodatでそれぞれのミラー用のを一発で選択取得出来るようになったらなー

バッチコマンド化計画はその辺までパラメータで指定できることを
目論んでたんですけどね。それができたら上で書いたsendkeysとかも
使う必要なくなりますし。
あと保存ファイル名とかもパラメータ化できたら後処理で保存とかやる必要も
なくなるわけです。

最近V2Cとかもたまに使ってるんですが、V2Cにもgetlogと同等の
スクリプトが使われてて、「ログ速は読めないの？」て話題は時折出るので
やっぱりやらないといけないかなーとあらためて思う今日この頃です。

# ちなみにV2C仕様のgetdat.jsスクリプトでは
# ファイルではなくdatの内容自体を返すように作られています
# こんなのにはどう対処したらいいんだろう？一旦テンポラリファイルに保存して
# 読み返すしかないのかな
130： ◆/vmukiyuzw：2012/11/19(月) 23:21:57: http://yy14.kakiko.com/test/read.cgi/mirror/1213700846/831

> それにしても、何行にも及ぶ前処理を組み込む仕様をどうしたもんでしょう？

私はJscriptにあんまり明るいわけではないのでわからないですが
663さんのスキルを持ってすれば「ログ速.bcr」をパースして配列に突っ込んで・・・
くらいのことは楽勝そうな気がするんですが・・・
（他のパラメタについてもそうですね）

ちなみに適当な過去ログでやってみましたが
「未変換行：～」が延々出て変換にはたどりつけないようですね。
おそらく、前処理をやってないので投稿日・ID周りの不要なものが取り除けてないので
（正規表現はそれを取り除いた前提で書いてるので）マッチしなくなっているようです。

ともあれ、いいものになりそうな雰囲気がするので、頑張っていただきたいです。
131： ◆/vmukiyuzw：2012/11/23(金) 00:24:06: ●大雑把な仕様

起動時の引数は最大3個取る
1つ目の引数はURL これが指定された場合HTML取得までは自動で行う
2つ目の引数はパラメータファイル名（パラメータファイルの仕様は後述）
　これが指定された場合「取得即変換」がONになり変換までは行う
3つ目の引数は出力ファイル名
　これが指定された場合変換結果をそこに出力しhtmltodatは終了する

●パラメータファイルの仕様

例えば
前処理=ログ速
のような形式で各項目に埋める選択項目を指定して列挙する
ただ、

前処理
なんちゃらかんちゃら
・・・

みたいに選択項目でなく直接正規表現等の内容を記述する形式も
できれば受け入れるようにしたい（サポートスレではそういう形式で書くことが多いから）

久しぶりに開発用のPCを起動してみるとトラブル続出でプログラム触れるようになるまでに
えらく難儀しました。
（というか現在常用のPCに開発環境を移してないだけなんですがこれはこれでなかなか面倒で）
このPCが本格的に壊れてしまうともうメンテできないかも・・・
基本的な仕様は難しくないと思うので誰か別の言語で書き直してくれないかしら
132： ◆/vmukiyuzw：2012/11/25(日) 01:57:39: バッチコマンド化計画で、パラメータファイルやregexps.txtをパースするのに
例によって正規表現でぱぱっと片付けようとしたんですがどうもうまくいかない。
デバッグしてて気づいたんですが、たまたまテストしてた例が

正規表現=したらば(jbbs)過去ログ

なんてものだったのですね。そう、「したらば(jbbs)過去ログ」でregexpa.txtを
検索しようとしたため、jbbsの前後の括弧が正規表現で意味を持ってしまうので
検索にヒットしない結果になってしまったわけです。
事前に括弧をエスケープしないといけないのか？いやそんなことしだしたら
エスケープしないといけないものは他にもいろいろあるよなあ・・・

結局地道に文字列操作関数使って処理することにしました（まあそれでも
大して難しくはなかったんですが）。
しかし思ったのはこういう問題って他でも出るような。SQLインジェクション
みたいな？（ちょっと違うか）
皆さんどうしておられるんでしょう。
133： ◆/vmukiyuzw：2012/11/25(日) 20:03:36: http://yy14.kakiko.com/test/read.cgi/mirror/1213700846/836
> dat化保存終了のタイミングがわからない事にはどうにもならないです。

・３つめの引数は出力datファイル名、これが指定された場合、変換結果をそこに出力し
　htmltodatは終了します。

と言う仕様にしたのはもちろん意味があって、
htmltodatを呼び出した側で終了を待機するようにすればよいと思ったからです。
（非同期でなく同期で起動すると言うことですね）

言語によりやり方は色々ですが大抵手段は用意されていると思うのですが。
ぐぐったらこんなのがありました。
http://d.aoikujira.com/blog/index.php?JScript%E3%81%A7%E3%82%B3%E3%83%9E%E3%83%B3%E3%83%89%E5%AE%9F%E8%A1%8C
134： ◆/vmukiyuzw：2012/11/28(水) 01:26:53: バージョン番号なんて大して誰も気にしてないだろうと思うけど
0.8.19はかなりの変更だったんで0.9.0にしとけばよかったかな。
135： ◆/vmukiyuzw：2012/12/01(土) 22:13:31: とりあえず以前からやりたかった
・バッチコマンド化
・文字コード変換をもう少しましに
・bregonigの採用
あたりが片付いてちょっと一段落ですかね～

あと前からやりたいと思ってたのが、現在パラメータファイルで指定できる内容の
セーブ・ロード機能なんですが、もともとの動機が
「htmltodatがfatal errorで落ちた時に落ちる前の内容を保存しておいて復帰させたい」
というかなりネガティブなものなので、bregonig採用で落ちることが少なくなるだろうと
思われる現状ではあんまり必要ないですかね。
（ほぼデバッグ用途向けの機能ですし）

まあ気が向けばそのうち。
136： ◆/vmukiyuzw：2012/12/02(日) 20:56:54: readmeの更新履歴をちょっと見返してたんですが、初版が2002/11/03なので
いつのまにか10周年越えてたんです。
10年前は何してただろう、この10年間で何してきただろう、と考えてみると
ほとんど何もしていない気がしてきてちょっと情けなくもある今日この頃です。