したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | メール | |

htmltodatサポートスレッド

1 </b><font color=#FF0000>(L44UP/ps)</font><b> :2002/11/30(土) 01:48
QA・要望等受け付けるかもしれない(?)スレッドです。
作者にスキルがないのでできないことが多いかとは思います。

1026 ◆/vmukiyuzw :2018/12/03(月) 02:22:11
今から見ると面白いなあと思うのが、663さんに対する私の発言で
(みみずんではUAをMonazillaにすればdat直読みできるという話題)

> 110 名前: ◆/vmukiyuzw [sage] 投稿日:08/09/21(日) 00:05:06 ID:f6dOajKh
> > htmltodatの受信ヘッダで
> > 送信するUAのデフォルトをMonazillaにして頂けたら嬉しいです。
>
> いわゆる「2ch専用ブラウザ」としての機能は何も持ち合わせてないのに
> UAでMonazillaを騙るのはおこがましいというか詐欺っぽいので
> あまりやりたくないです。
> # まあやったところで何か実害が出るとかいうことはないとは思いますが・・・
>
> 筋道としては、問題と思われるなら整理してみみずんさんに提示するほうが先では?
> てもうされてたならすみません。

などと語っていること^^;
このときは後に「専ブラでもないくせに何でUAでMonazillaを名乗ってるの?」とか
叩かれることになろうとは想像もしてなかったですw

1027 ◆/vmukiyuzw :2018/12/18(火) 21:17:14
バージョンアップしました(0.11.12)
 ・0.11.10で導入したIndy10により発生した文字化け問題に対応。

>>1020-1021で発覚した文字化け問題への対応です。

以前使っていた通信コンポーネントIndy9では、HTTPのGET処理を実行して返ってくるデータは
サーバが返してくるほぼそのままだったので、gzipの解凍だとか文字コード変換とかは
全部アプリ側でやらなきゃいけなかったんです。
けどIndy10ではその辺をある程度やってくれる・・・ので楽になった部分もあるのですが
文字コード変換に関しては私見ですがいまいちな感じ。うちの開発環境が古いんで
それとの相性かもしれませんが。
HTTPレスポンスヘッダのCharSet等から文字コードを判別してるようなのですが
>>710>>1000みたいなdat形式でアクセスする場合CharSetは指定されておらず、
その場合全然違う文字コードと解釈されて変な変換されて結果文字化けしてしまう、
という状況のようでした。
(html形式でのアクセスの場合はCharSetは大抵指定されてるので問題なかったと思われる)

で、結局、文字コード変換を行わない別のGET処理が用意されてるのを見つけたので
そっちを使うよう変更しました。
(つまり文字コード変換は従来通り自力でやる)

プログラムとしては数行の変更ですが内部処理はかなり変わってると思うので
いろんなサイトでテストしたつもりですがもし問題あればご連絡ください。

1028 名無しさん :2018/12/19(水) 22:12:22
>>1027
乙でございます

いくつか試してみて今のところ問題ありません

1029 ◆/vmukiyuzw :2018/12/20(木) 21:32:31
別件で調べものしててたまたま見つけたんですが。
>>1024-1026で出てきた663さん(mirrorhenkanさん)の掲示板ですが
http://mirrorhenkan.r.ribbon.to/b/board/
で復活されてたんですね。2015年2月ごろでしょうか。
わいわいかきこ時代のログも移されてますし専ブラでも外部板登録すれば読めます。

で、専ブラでこの板のログを取得し、
http://yy14.kakiko.com/mirror/
も外部板登録してそちらにsubject.txtとdatをコピーすれば、
例えば>>737のようなリンク切れして見られない663さんの板へのリンクが
見られるようになるのではないかと思います。

かつていろいろやりとりしhtmltodatの機能アップにつながるご意見を
色々頂いたので、そのログがwebarchiveとかじゃなく見られる形であるのが
嬉しいです。

1030 1020 :2018/12/22(土) 09:00:10
>>1029
>>1024=1020っす おー、朗報ですね
kakiko時代のスレを読む方法として他に、Jane系のようなレスの置換機能のある専ブラなら
ttp://mirrorhenkan.r.ribbon.to/b/board/ を外部板登録して
<rx2>h?ttp://yy14\.kakiko\.com/test/read\.cgi/mirror/【TAB】<font color=green>[yykakiko]</font> ttp://mirrorhenkan.r.ribbon.to/b/test/read.cgi/board/【TAB】msg
てな感じでリンクの方を置換しちゃうのもありです
これなら ttp://yy14.kakiko.com/mirror/ のほうは外部板登録しなくてよいので

1031 名無しさん :2019/01/27(日) 06:04:34
受信オプションボタンを押してURLの変換のところで
次の2つを変換したいと思いますが2つ目の変換がされません
s/2ch/5ch/
s/https/http/
実際の記述はどのようにすればよいのでしょうか?

1032 ◆/vmukiyuzw :2019/01/29(火) 00:24:11
>>1031さん
こちらで検証してみても特に問題はないので記述に問題はないと思われます。
何をもって2つ目の変換がされないと思われたのでしょう?
私の環境ではプロキシソフト(Proxomitron Rebornてやつ)で通信ログを見て
正しく変換されてると思ったのですが。

1033 ◆/vmukiyuzw :2019/01/29(火) 00:32:59
ちなみに、htmltodatでは現在のバージョンではSSL/TLSに対応しているので
s/https/http/
これは不要のはずです。(httpsのアドレスでもアクセス可能)

1034 1031 :2019/01/30(水) 05:47:37
>>1032
解決しました。
古い0.11.8を使用していました。
せっかく作者様がいろいろ対応して下さっている最新版を使わずに質問してすみませんでした。
あまりよく理解していないままですが便利に使用させて頂いております。
変換がうまくいかない場合はサポートBBSにある正規表現を使ってみてうまく行ったら後は何も触らず似使っています。
https://の場合はURL貼り付け後にsを取るためにIビームポインタを合わせるのに苦労していました。
また、2ch.netでうまくいかなくなってきて5ch.netに修正するときにも面倒な作業をいちいち操作して使っていました。
いざ自分の直面している問題に関係しているとBBSの内容も少しずつ理解できるようになってきました。
OpenSSLのところのダウンロードもうまくできました。

このようなソフトウェアを使わせて頂きありがとうございます。
普段はブラタモリの録画を見ながら実況スレを探し出してJaneStyleで見るといういうような使い方が多いです。
放送後間もないときは実況Headline板で該当URLを1個ずつコピーしています。
日にちが経ってしまったときはGoogleでsite:5ch.netのようにサイト指定して当時のスレを探しています。
とにかくこのソフトがあってこそ、です。

配布ページの下の方にあるAmazonのリンクを経由して、少額だと思いますが買い物するようにします。
ありがとうございます

1035 ◆/vmukiyuzw :2019/01/31(木) 02:17:26
>>1034さん
htmltodatの使い方というわけではないのですが

> 普段はブラタモリの録画を見ながら実況スレを探し出してJaneStyleで見るといういうような使い方が多いです。
> 放送後間もないときは実況Headline板で該当URLを1個ずつコピーしています。
> 日にちが経ってしまったときはGoogleでsite:5ch.netのようにサイト指定して当時のスレを探しています。

こうやって過去ログを追っかけるときは、
板TOP(NHK実況ならhttps://nhk2.5ch.net/livenhk/)から
「過去ログ一覧はこちら」をクリックして出てくる過去ログの一覧
https://nhk2.5ch.net/livenhk/kako/kako0000.htmlとか)を見る方が
はかどるかもしれません。
まあこっちもあまり日にちが経ってしまうとしまうと見られなくなるみたいですが
Googleだと流れのはやいスレは追えないことがよくあるのでそれよりは確実な気がします。。

> 配布ページの下の方にあるAmazonのリンクを経由して、少額だと思いますが買い物するようにします。

配布ページは無料レンタルサーバなのでそんなことされても私には一文も入ってきません^^;
道楽でやってることですのでお気遣いなく。

1036 名無しさん :2019/01/31(木) 07:41:02
最初に謝っておきます。◆/vmukiyuzwさん、htmltodatに関係ない話してすみません!!

>>1034
そんなあなたに便利なサイトをご紹介。(中の人ではありません)
ttp://2chlog.com/2ch/live/calendar.php?ita=livenhk
ここから日付に飛ぶとその日に立ったスレの一覧が見られ、(10桁の数字).datを右クリでダウンロードすると
datが手に入ります(htmltodatで変換しなくてよい)
スレ立て基準なので、ブラタモリなら放送日を見ればよいですが
深夜番組などの場合は当日と前日の両方を見たほうがよいです
NHK以外の板もありますが、テレビ実況系のみです

>>1035
日にちが経っても見られるはずですよ
ただ、Listがスレッド番号表記のみなので、スレ立て日がわかっていても
(だいたいの)UnixTimeに直すのがちょっと面倒ですね
昔実況系板のkako####.html生成がなんかで失敗してたことがあったんですが
(【pastdat】新型DAT落ち装置●旧おせっかい Part.4 [無断転載禁止]©2ch.net
 ttp://carpenter.2ch.net/test/read.cgi/operatex/1462280087/389-391,434 2016/05でした)
Mangoさんがそっこー直してくれたんで、あるはずのスレが一覧になかったら報告すれば直ると思います

1037 ◆/vmukiyuzw :2019/02/01(金) 22:41:01
>>1036さん
便利なサイトご紹介いただきありがとうございます。
ミラーサイトってのも今時なかなか運営が難しそうな気がするのですが
頑張ってる方もまだおられるのですね。

> ただ、Listがスレッド番号表記のみなので、スレ立て日がわかっていても
> (だいたいの)UnixTimeに直すのがちょっと面倒ですね

確かにそうだと思ったので、過去ログ一覧ページにあるスレッド番号らしき記述を
年月日時分秒に変換するブックマークレットをとりあえず書いてみました。
ただあのページ自体使い勝手はかなり悪いのでこれぐらいでたいして
改善されるわけではないんですが。

javascript:(function(){document.body.innerHTML=document.body.innerHTML.replace(/(\d{9,10})((?=[\-\s\<])|\.dat)/g,function(ma){var n=ma.replace(/\.dat/,"")-0;n*=1000;var d=new Date(n);var year=d.getFullYear();var zp=function(a){return(('0'+a).slice(-2))};var month=zp(d.getMonth()+1);var day=zp(d.getDate());var hour=zp(d.getHours());var min=zp(d.getMinutes());var sec=zp(d.getSeconds());return(year+'/'+month+'/'+day+' '+hour+':'+min+':'+sec)})})()

1038 名無しさん :2019/02/16(土) 09:13:59
昨晩、ドキュメント72時間,トクサツガガガ,タモリ倶楽部,フルーツ宅配便,日本ボロ宿紀行と録画したのでJaneStyleで読むログをゲットすることに。
htmltodatで気になっていた一括変換ボタンというのを使えないかなと思いました。
いまなら実況headline板に生きてるからURLがコピーできる。

プログラムのあるフォルダに[変換前]、[変換後]という名前の二つのフォルダを作りました。
[変換前]フォルダの中にはどのようなファイルを置けばいいのでしょうか?
JaneStyleのアドレス欄は以下のようになっていて拡張子htmlではありません。
  https://headline.5ch.net/test/read.cgi/bbylive/1550230754/

Webブラウザで2chを見ているときはHTMLファイルを読み込んでいて、専用ブラウザで2chを見ているときはDATファイルを読み込んでいると理解しています。
htmlファイルを得るにはブラウザーで開くのでしょうか?開いてみましたがアドレスバーのところには
 https://nhk2.2ch.net/test/read.cgi/livenhk/1550230754/
となっていて拡張子が見あたりません。
 https://nhk2.2ch.net/test/read.cgi/livenhk/1550230754/index.html
とか
 https://nhk2.2ch.net/test/read.cgi/livenhk/1550230754.html
ということなのかな。。。アッ、これでいいのか!わかりましたw

[変換後]フォルダはテストなので作成しました。将来は[\Jane Style\Logs\2ch\実況ch\番組ch(NHK)]などを直接指定しようと思います。

それではドキュメント72時間3スレ、トクサツガガガ10スレ、タモリ倶楽部3スレ、フルーツ宅配便2スレ、日本ボロ宿1スレ
これらのURLをコピーして一つのテキストファイルの中に一行づつ、、、なんか違う。
あ、このフォルダの中に、1スレにつき1個のhtmlファイルを置いていくのか。
これだと面倒さは今までと変わらないな

なんか、こんなことをさっきまでやってました。質問しようと思っていましたがなんだかわからなくなってしまいました。
日本ボロ宿紀行の主役は朝ドラのよしのちゃんで、キャプのリンクも生きていてよかったです。


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

■ したらば のおすすめアイテム ■

ガールズ&パンツァー これが本当のアンツィオ戦です! [Blu-ray] - 水島努

ドゥーチェ! ドゥーチェ! ドゥーチェ! ドゥーチェ! ドゥーチェ! ドゥーチェ! ドゥーチェ! ドゥーチェ! ドゥーチェ! ドゥーチェ! ドゥーチェ! ドゥーチェ!

この欄のアイテムは掲示板管理メニューから自由に変更可能です。


掲示板管理者へ連絡 無料レンタル掲示板