[
板情報
|
カテゴリランキング
]
したらばTOP
■掲示板に戻る■
全部
1-100
最新50
|
メール
|
1-
101-
201-
301-
401-
501-
601-
701-
801-
901-
1001-
1101-
この機能を使うにはJavaScriptを有効にしてください
|
htmltodatサポートスレッド
1092
:
◆/vmukiyuzw
:2023/10/11(水) 04:06:42
昨日ちょっと専ブラから5chにつながらないときがあって
chromeから見てたのですが、read.cgiのバージョン表記が
read.cgi ver 07.4.4 2023/10/10
となっていて、なんかバージョン番号が先祖返りした感じですね。
しばらくなくなってたエッチな広告もなんか復活してますし…
とはいえ、htmlの形式自体は
>>1082
以降で対応してきた08系と
特に変わりはないようなので問題はなさそうですが。
1093
:
◆/vmukiyuzw
:2023/12/21(木) 05:43:46
>>1078
のスクリプトなのですが、最近5chの過去ログ倉庫が文字化けだらけで使い物にならん…
と思ってたら運用情報板に「過去ログ見たいならscを使え」みたいなスレが立ってて、
なるほどそういう手もあるかと思いスクリプトを改修してました。
でも 5ch.net と 2ch.sc では同じ板でもサーバ名が違う…
これはスクリプトレベルではどうしようもないので、運用上で回避することを
考えていました。
でも、ここ数日で文字化けは(全板かどうかわかりませんが)改善されたようなので
スクリプト改修の公開は保留にします。
1094
:
名無しさん
:2024/02/25(日) 12:58:16
htmltodatでしたらばの過去ログで2012年〜2013年は正規表現の項の「DAT2HTML0.26」で読み込めますが
2013後半〜以降の過去ログ・現行ログを取得する方法はありますか?
例としてここのURLで試しましたが正規表現が正しくないと表示されました
https://jbbs.shitaraba.net/bbs/read.cgi/computer/1929/1038588508/
>>864
氏のprmを試した見ましたがうまくいきませんでした
1095
:
◆/vmukiyuzw
:2024/02/28(水) 00:41:50
>>1094
さん
したらば過去ログの話題は久々ですね、それこそ
>>864
さんの話題以来かな。
まず、したらばは過去ログと現行ログを分けて考えるする必要があると思います。
過去ログについては昔も今も正規表現「jbbs過去ログ」が使えると思います。例として
http://jbbs.shitaraba.net/bbs/read.cgi/computer/1929/1024130759/
(
>>864
さんもテストに使われたこの板の過去ログ。2002年のもの)
https://jbbs.shitaraba.net/bbs/read_archive.cgi/sports/43156/1700655438/
(したらばトップから適当に探した過去ログ。2023年のもの。ただしレス番飛びが
あるようで警告は出る)
20年を隔てても使えるようですw
現行ログについては以前
>>622
で考えたことがあるのですが、そのときとは
read.cgiが吐くhtmlの形式がかなり変わっており同じ手は使えないようです。
したらばにはrawmode.cgiという5chのdatと近い形式のデータを返す機能が
あるので、これを使う方向で考えてみました。。
(以前、
https://jbbs.shitaraba.net/bbs/read.cgi/computer/1929/1038409548/124
で考えたことがあるのですが、レス番飛びを検出できないのであまりよい方法ではない)
いざやってみると思ったより面倒でしたが…^^;
コメント:
したらばの現行ログをrawmode.cgi経由で変換する
URLの変換:
s`read\.cgi`rawmode\.cgi`
前処理:
s`(\d+)<>(.*?)<>(.*?)<>(.*?)<>(.*?)<>(.*?)<>(.*?)\\?\n`$1<>$2<>$3<>$4 ID:$7<>$5<>$6<>\n`img
透明あぼーんを補う:
true
変換結果式:
$2<>$3<>$4<>$5<>$6<>
正規表現:
m`(\d+)<>(.*?)<>(.*?)<>(.*?)<>(.*?)<>(.*?)<>(.*?)`ig
1096
:
◆/vmukiyuzw
:2024/02/28(水) 00:49:00
>>1095
と長々と書いときながらなんですが、正直言うと
したらばに対応してる専ブラ使う方が絶対楽だと思いますよ。
Xenoとかおすすめです。
上で書いたような、過去ログと現行ログの違いもユーザーが
意識せずとも勝手にやってくれますし。
「いやいや使い慣れたブラウザで見たいんじゃー」
てことかもしれませんが、それならしたらば対応専ブラから
dat持っていけばいいんじゃない?と思います。
ここで質問されてる以上、htmltodatで作ったdatを持って
いくのでしょうから、それを対応専ブラにやらせると考えれば
手間はそれほど変わらないのでは。
1097
:
1094
:2024/02/28(水) 17:42:11
返信ありがとうございます
作成して頂いたprmでタイトルを取得できなかったものの現行ログのdat化が出来ましたありがとうございます
提示して頂いた過去ログでは「jbbs過去ログ」を試したところ
https://jbbs.shitaraba.net/bbs/read_archive.cgi/sports/43156/1700655438/
ですが私の環境では正規表現が正しくないと表示され返還できませんでした
同様に以下でも試しましたが同じです。おま感でしょうか
https://jbbs.shitaraba.net/bbs/read_archive.cgi/internet/14562/1533538138/
Xenoでしたらばが読み込めるのは盲点でした要は使い分けですね
htmltodatは現状2ch時代の過去ログが閲覧できない状態でも
み○ずんやビュアデモといった所からdat化出来る為大変重宝しております
1098
:
◆/vmukiyuzw
:2024/02/29(木) 01:35:49
>>1097
さん
> 作成して頂いたprmでタイトルを取得できなかったものの
すみません、タイトルを取得できないのは私のミスです。
prmファイル中の
変換結果式:
$2<>$3<>$4<>$5<>$6<>
これを
変換結果式:
$2<>$3<>$4<>$5<>$6
にしてください(最後の<>が余分だった)。
> 私の環境では正規表現が正しくないと表示され
これはわからないですね。
> 同様に以下でも試しましたが同じです。
とあげていただいたスレもこちらでは変換できましたし。
書かれてないですがこの板(私が例示した一つ目)は変換
できたのでしょうか?
「jbbs過去ログ」の正規表現の内容が違っているのかな?
「jbbs過去ログ」の正規表現は
m#<DT><A.*?>([0-9]+).+?(?:<A HREF="mailto:(.+?)">)?<B> ?(.*?) ?</B>(?:</A>|</FONT>)(?: 投稿日)?: ?(.*?)(?:<BR>)?<DD>(.*) ?<BR><BR>#mik
なのですが、これを直接htmltodatの正規表現欄にコピペして
やってみてもダメですかね?
(これは
>>864
で書かれた正規表現と同じものなのですが
>>864
さんはこれでうまくいったようです)
1099
:
1094
:2024/02/29(木) 18:36:41
ありがとうございます
何度も御対応して頂き本当に申し訳ない
画像を含めて結果だけ報告します
前提としてソフトは再起動後の状態からそれぞれ試しています
テストその1
http://jbbs.shitaraba.net/bbs/read.cgi/computer/1929/1024130759/
【画像】
https://i.imgur.com/Hc9EgZl.jpeg
上記スレでは正規表現一覧内の[jbbs過去ログ]で問題無くdat化する事が出来ました
ノルマンディーOC 【99】
https://jbbs.shitaraba.net/bbs/read_archive.cgi/sports/43156/1700655438/
上記スレでは[jbbs過去ログ]及び[jbbs過去ログ改]と
【m#<DT><A.*?>([0-9]+).+?(?:<A HREF="mailto:(.+?)">)?<B> ?(.*?) ?</B>(?:</A>|</FONT>)(?: 投稿日)?: ?(.*?)(?:<BR>)?<DD>(.*) ?<BR><BR>#mik】
を直接入力及び>864氏のprmも試した所をした所dat化は無理でした
htmlもそのまま出力されてしまっている様です
【画像】
https://i.imgur.com/KQwdUVU.jpeg
現行ログの件ですが
【画像】
https://i.imgur.com/Ep94tap.jpeg
「$2<>$3<>$4<>$5<>$6」にしてもスレタイを取得できなかった為
やはり私の環境に何かファイルの欠落があるのかもしれません
返信頂きありがとうございました
以下はテスト環境です
htmltodat Ver 0.11.12
エディション Windows 10 Home
バージョン 22H2
インストール日 2021/05/17
OS ビルド 19045.3930
エクスペリエンス Windows Feature Experience Pack 1000.19053.1000.0
1100
:
◆/vmukiyuzw
:2024/03/01(金) 01:02:09
>>1099
さん
なんとかわかった気がします。
まず過去ログに関してですが、
受信オプション - HTTPヘッダの追加 で
User-Agent: Monazilla/1.00
を指定してみてください。正規表現は「jbbs過去ログ」でいいです。
これで、お試しくださった「テストその1」も
「ノルマンディーOC 【99】」も変換できると思います。
私の環境でうまくいっていたのは、一旦このUAの指定をした後、リセット
しないままテストしていたためと思われます^^;
なぜそういうことになるのかはしたらば側の事情になるので推測に
過ぎないですが、
・(最初のご質問
>>1094
にあった)多分2013年頃に過去ログhtmlの形式が変更された
・が、User-AgentでMonazillaを名乗るもの
(したらば過去ログに対応していたと思われる専ブラ)
からのリクエストには影響が出ないよう、元の形式のhtmlを返すようにされた
ということではないかと思います。
あと現行ログについてですが、htmltodatのプレビュー欄には
<タイトル無し>と出てしまうのですが、実際にはdat上には
スレタイはちゃんと出力されてるので、お使いの専ブラ
(何をお使いなのか参考に教えていただけるとありがたいです)
に持っていけばスレタイは認識してくれると思いますよ。
<タイトル無し>と出てしまうのは、通常のhtmltodat変換とちょっと違う
イレギュラーな手法を使ってるせいで、プレビュー欄のタイトルをうまく
取得できていないだけです。
「それ不具合ちゃうん?」と言われるかもしれないですがご容赦ください^^;
1101
:
1094
:2024/03/01(金) 18:28:19
度々の対応ありがとうございます
助言通りに「User-Agent: Monazilla/1.00」を設定した所
無事にしたらばの過去ログのdat化に成功しました
https://i.imgur.com/yiK9My1.jpeg
本当にありがとうございます!
現行ログのタイトルもしっかり出力されていました
(dat化した後読み込んでちゃんと確認しておくべきでした申し訳ない)
使用していたのは「jane style」でした(dat出力機能が標準で付いていた為)
現在は「Xeno」を使おうと思って色々設定を弄ってる所です
本当にありがとうございました
私事ですが
現状5ch(2ch)界隈でゴタゴタしてて過去ログも見れない状態が続いてるので
この手の知識が無いなりにスレのdat化やサルベージを何とか進めている最中です
現在はonen2chのdat化を試みています
openは対応しているブラウザが多いので読み込めたりしますが
datが消滅しているスレ
https://wktk.open2ch.net/test/read.cgi/aimasu/1477275318/
https://wktk.open2ch.net/aimasu/dat/1477275318.dat
等は専ブラでは読み込めない為色々試している最中です
では長々と失礼いたしました
1102
:
◆/vmukiyuzw
:2024/03/05(火) 23:43:26
>>1094
さんの丁寧なご報告のおかげ🙂でひと段落付いたようなので
現状を一旦prmの形にまとめておきます。これに対するレスは不要です。
まずしたらば過去ログ。
コメント:
したらばの過去ログを変換する
以前は正規表現=jbbs過去ログだけで行けたが
いつからかhtmlの形式が変わり、旧形式のhtmlを得るには
UAを指定する必要が出てきたようだ
HTTPヘッダの追加:
User-Agent: Monazilla/1.00
正規表現=jbbs過去ログ
1103
:
◆/vmukiyuzw
:2024/03/05(火) 23:46:54
次にしたらば現行ログ。
前に書いたものに若干のバグがあり少し修正してます。
まあ実験的なものであまり使われることはなさそうですが。
コメント:
したらばの現行ログをrawmode.cgi経由で変換する
・前処理
したらばのrawmode.cgiの出力は
レス番<>名前<>メール欄<>投稿日時(ID含まない)<>レス内容<>スレッドタイトル<>ID
なのでID($7)を投稿日時($4)の後ろに移す
・正規表現
各欄にそのまま当てているだけだが処理中に$1でレス番飛びのチェックをしているので必要
URLの変換:
s`read\.cgi`rawmode\.cgi`
前処理:
s`(\d+)<>(.*?)<>(.*?)<>(.*?)<>(.*?)<>(.*?)<>(.*?)\\?\n`$1<>$2<>$3<>$4 ID:$7<>$5<>$6 <>\n`img
# IDがない板の場合削除
s` ID:<>`<>`img
透明あぼーんを補う:
true
変換結果式:
$2<>$3<>$4<>$5<>$6
正規表現:
m`(\d+)<>(.*?)<>(.*?)<>(.*?)<>(.*?)<>(.*?)<>(.*?)`ig
1104
:
名無しさん
:2024/04/02(火) 11:34:48
>>1080
から5chの仕様が変更されたようなので正規表現をお願いできないでしょうか?
#メールが空欄になってしまい、すべてのレスが”壊れていますになり、日付が取得されません、
#03/31に変更?k"
1105
:
◆/vmukiyuzw
:2024/04/03(水) 03:02:34
>>1104
さん
修正箇所はすぐわかったのですが別件で手こずってました…
その件はまだ片付いてないのですがとりあえず。
HTMLソース見てみると、各レスのメール欄と投稿日欄の間に
「垢版」という謎のリンク(5ch運営が推してるUPLIFT?に
関連してるぽい)が追加されたので、以前の正規表現では
マッチしなくなってます。それ以外に変更はなさそう。
追加部分にぴったりマッチさせる正規表現書いても良かった
のですがまだ変更ありそうな気がしたので
</summary><span\ class="date">の前に.*?(何文字でもいい
最短マッチ)を追加するだけにしました。
コメント:
# 5chのread.cgi 08系からの出力を変換-2024/04/03
# 5chのcgi仕様変更(07.4.7 2024/03/31)に対応
URLの変換:
# htmltodat 0.11.10以降を使っていればこれはなくてもよい
s#https?://(.+?)/test/read\.cgi/(.+?)/(\d+)/?.*#http://$1/test/read.cgi/$2/$3/#
前処理:
# メール欄にURLが貼られた時のとりあえず対応
s#(<a href="mailto:)([^<>]*?)(?:<a href[^>]*?>)?([^<]*?)(?:</a>)?([^>]*?)(">)#$1$2$3$4$5#ig
# ガラガラ削除
s#^(.|\n)*?<div id="thread"##igk
アンカー削除:
false
透明あぼーんを補う:
true
後処理:
# BE周りの処置
s#</span><span class="be .*?><a href=".*?//be\.(?:[25]ch\.net|bbspink\.com)/user/(\d+).*?>\?(.*?)</a># BE:$1-$2#ig
# アンカータグ削除(レスアンカーに対するタグは削除しない)
s#<a(?: class="image")? href="http.*?>(.*?)</a>#$1#igk
# お絵かき機能等のimgタグを除去
s#<img src=".*?(//.*?)">#sssp:$1#igk
# IDの前に付くようになった不要なタグを除去
s#</span><span class="uid"># #igk
# 07.2.1で追加された不要な要素を除去
s#<><span class="AA">(.*?)</span><>#<>$1<>#igk
s#(target="_blank").*?>#$1>#igk
正規表現:
m`
(?# レス番号)<span\ class="postid">([0-9]+)</span>
(?# 名前)<span\ class="postusername"><b>
(?# メール欄)(?:<a\ href="mailto:(.*?)">)?(.*?)(?:</a>)?</b></span>
(?# 投稿日・ID).*?</summary><span\ class="date">(.*?)</span>
(?# レス内容)</details><section\ class="post-content">(.*?)</section>
`mix
1106
:
名無しさん
:2024/04/03(水) 20:12:10
>>1104
さん、ありがとうございました。
ただし、以下が失敗します
http://kes.5ch.net/test/read.cgi/operatex/1690139851/5.75.101
1107
:
◆/vmukiyuzw
:2024/04/03(水) 21:29:08
>>1106
さん
「失敗します」とは具体的にはどういう状況でしょうか?
こちらでは問題なく(いや、本当はスレタイが取れないという問題が
あるのですがそれはまた改めて)変換できているようなのですが。
例示いただいたレス番はどれも名前欄に🐙(蛸マーク?)が
含まれているようですがこれの表示で問題が起きてるってことですかね?
差し支えなければお使いの専ブラ教えてください。
1108
:
名無しさん
:2024/04/04(木) 12:08:02
>>1107
>さん
04/03は”壊れています”が出ました(メール欄なし、日付取得不可)
04/04朝現在は名前欄にタコ(<span>🐙</span>)が含まれて正しく変換されます
(JaneViewを使用してます)
1109
:
◆/vmukiyuzw
:2024/04/04(木) 22:57:30
>>1108
さん
えっと、昨日はうまくいかなかったけど今日はうまくいったと???
結局うまくいったということでいいんでしょうか…?^^;
専ブラの種類をお聞きしたのは名前欄の<SPAN>タグや数値文字参照に
対応してないものがあるのかなと思ったからです。Viewだと問題ない
はずですね。
あと
>>1107
で書いた「スレタイが取れない」問題ですが、
>>1105
で書いたprm内容のうち、前処理の
# ガラガラ削除
s#^(.|\n)*?<div id="thread"##igk
(HTMLソース先頭からレス1の直前までを削除する意図)
のせいで、<title>〜</title>を削除してしまうという凡ミスを
やっちゃってました。ですがこれは
>>1105
の元にした
>>1082
から
起きていたはずなんですが…
ともあれ、「先頭からレス1の直前までを削除」を
「</title>タグの直後からレス1の直前までを削除」するように
変更します。
コメント:
# 5chのread.cgi 08系からの出力を変換-2024/04/04
# 5chのcgi仕様変更(07.4.7 2024/03/31)に対応
# 前処理のガラガラ削除でスレタイを削除してしまうバグを修正
URLの変換:
# htmltodat 0.11.10以降を使っていればこれはなくてもよい
s#https?://(.+?)/test/read\.cgi/(.+?)/(\d+)/?.*#http://$1/test/read.cgi/$2/$3/#
前処理:
# メール欄にURLが貼られた時のとりあえず対応
s#(<a href="mailto:)([^<>]*?)(?:<a href[^>]*?>)?([^<]*?)(?:</a>)?([^>]*?)(">)#$1$2$3$4$5#ig
# ガラガラ削除
s#(</title>)(.|\n)*?<div id="thread"#$1#igk
アンカー削除:
false
透明あぼーんを補う:
true
後処理:
# BE周りの処置
s#</span><span class="be .*?><a href=".*?//be\.(?:[25]ch\.net|bbspink\.com)/user/(\d+).*?>\?(.*?)</a># BE:$1-$2#ig
# アンカータグ削除(レスアンカーに対するタグは削除しない)
s#<a(?: class="image")? href="http.*?>(.*?)</a>#$1#igk
# お絵かき機能等のimgタグを除去
s#<img src=".*?(//.*?)">#sssp:$1#igk
# IDの前に付くようになった不要なタグを除去
s#</span><span class="uid"># #igk
# 07.2.1で追加された不要な要素を除去
s#<><span class="AA">(.*?)</span><>#<>$1<>#igk
s#(target="_blank").*?>#$1>#igk
正規表現:
m`
(?# レス番号)<span\ class="postid">([0-9]+)</span>
(?# 名前)<span\ class="postusername"><b>
(?# メール欄)(?:<a\ href="mailto:(.*?)">)?(.*?)(?:</a>)?</b></span>
(?# 投稿日・ID).*?</summary><span\ class="date">(.*?)</span>
(?# レス内容)</details><section\ class="post-content">(.*?)</section>
`mix
1110
:
名無しさん
:2024/10/24(木) 19:33:29
5ch(旧2ch)の過去ログが鯖移転を経て復旧し始めてるようです
例:
https://kako.5ch.net/test/read.cgi/liveplus/1261703768/
ですが
>>1109
だとdat変換できない様です
というかソフトがハング状態?応答停止になってしまいますね。これはおま感でしょうか
1111
:
◆/vmukiyuzw
:2024/10/26(土) 03:40:36
>>1110
さん
https://agree.5ch.net/test/read.cgi/operate/1697962402/
とかで話されてることかな?
kako.5ch.net のサーバで使われてる read.cgi は
read.cgi ver 07.5.6 2024/10/18 [ver:kako]
となっていてバージョンアップしており、前のバージョンと比べて
dat変換には不要な要素が増えていて
「一行が長すぎるが、正規表現が正しくないようです」エラーが
出てしまうようです(自分の環境ではハングはせずこのエラーになります)。
まあ一応対処はできたと思うのですが、先に書いておきたいことが…
現状、5chの現行ログであれ過去ログであれ read.cgi で読もうとすると
全て itest.5ch.net にリダイレクトされてしまうようです。
itest の出力はスクリプト等でクライアント側でHTMLを組み立てる
タイプの奴なので htmlodat ではdat変換できません。
てことは
>>1109
以前から書いてきた 5ch.net 向けの正規表現等は
もう使えなくなる可能性があります。もう誰も使ってないだろうけど
htmltodatByFiddler も使えなくなってるだろうなあ…
まあ現状、今生きてるサーバの現行ログ及び過去ログはdatの形式で
取得できるし、対応してる専ブラなら読めるし、実際はそれほど困る
ことはないのかな。kako.5ch.net のログも専ブラで読めるようになれば
いいのに。
ともあれ長く、遅くなってしまったので
・kako.5ch.net のログを htmltodat で取得するには
・5ch.net のdatを(itestに飛ばされずに) htmltodat で取得するには
の説明はまた明日にでも(予定w)
1112
:
◆/vmukiyuzw
:2024/10/27(日) 04:19:51
>>1111
続き
まず「kako.5ch.net のログを htmltodat で取得するには」から。
>>1109
を少し修正しました。
https://agree.5ch.net/test/read.cgi/operate/1697962402/464
にあった
https://kako.5ch.net/test/read.cgi/news/1234567893/
を変換したとき、スレタイにURLが出てきて「え、何か間違った?」と思ったのですが
そういうスレだったようです(スレ番1234567890を狙ってスレ立て、みたいな)
コメント:
# 5chのread.cgi 08系からの出力を変換-2024/10/27
# 5chのcgi仕様変更(07.5.6 2024/10/18[ver:kako])に対応
#
URLの変換:
# htmltodat 0.11.10以降を使っていればこれはなくてもよい
s#https?://(.+?)/test/read\.cgi/(.+?)/(\d+)/?.*#http://$1/test/read.cgi/$2/$3/#
前処理:
# メール欄にURLが貼られた時のとりあえず対応
s#(<a href="mailto:)([^<>]*?)(?:<a href[^>]*?>)?([^<]*?)(?:</a>)?([^>]*?)(">)#$1$2$3$4$5#ig
# ガラガラ削除
s#(</title>)(.|\n)*?<div id="thread"#$1#igk
s#</article><div class="navmenu">(.|\n)*##igk
アンカー削除:
false
透明あぼーんを補う:
true
後処理:
# BE周りの処置
s#</span><span class="be .*?><a href=".*?//be\.(?:[25]ch\.net|bbspink\.com)/user/(\d+).*?>\?(.*?)</a># BE:$1-$2#ig
# アンカータグ削除(レスアンカーに対するタグは削除しない)
s#<a(?: class="image")? href="http.*?>(.*?)</a>#$1#igk
# お絵かき機能等のimgタグを除去
s#<img src=".*?(//.*?)">#sssp:$1#igk
# IDの前に付くようになった不要なタグを除去
s#</span><span class="uid"># #igk
# 07.2.1で追加された不要な要素を除去
s#<><span class="AA">(.*?)</span><>#<>$1<>#igk
s#(target="_blank").*?>#$1>#igk
正規表現:
m`
(?# レス番号)<span\ class="postid">([0-9]+)</span>
(?# 名前)<span\ class="postusername"><b>
(?# メール欄)(?:<a\ href="mailto:(.*?)">)?(.*?)(?:</a>)?</b></span>
(?# 投稿日・ID).*?<span\ class="date">(.*?)</span>
(?# レス内容)</details><section\ class="post-content">(.*?)</section>
`mix
1113
:
◆/vmukiyuzw
:2024/10/27(日) 04:23:27
続いて、5ch過去ログ(現行サーバ・板でdat落ちしたもの)用です。
やってることは、read.cgiへのリクエストを過去ログへのdatへの
リクエストに変換してるだけです。
(5chのお知らせからの引用ですが
/板名/oyster/スレッドキー上位4桁の数字/スレッドキー.dat
例:
https://agree.5ch.net/operate/oyster/1684/1684064837.dat
)
5chがJaneと手を切ってから解放されてる方法で、対応してる
専ブラも多いと思います。
htmltodatとしてはURLを変換して取得結果をそのまま出力しているだけなので
HTML→dat変換処理は通っていません。なのでプレビューは出ないです。
コメント:
# 5chのdatをread.cgiを介せずそのまま取得-2024/10/27
# 5chの過去ログ(現行サーバでdat落ちしたもの)用
#
URLの変換:
s#https?://(.*?)/test/read\.cgi/(.*?)/(\d{4})(\d+).*#http://$1/$2/oyster/$3/$3$4.dat#
dat変換をしない(前処理のみ行う):
true
アンカー削除:
false
1114
:
◆/vmukiyuzw
:2024/10/27(日) 04:25:24
あと、一応5ch現行ログからdatへの変換用です。
大抵の専ブラはこんなのなくても読めるはずなので特にニーズはなさそうですがw
コメント:
# 5chのdatをread.cgiを介せずそのまま取得-2024/10/27
# 5chの現行ログ用
#
URLの変換:
s#https?://(.*?)/test/read\.cgi/(.*?)/(\d+).*#http://$1/$2/dat/$3.dat#
dat変換をしない(前処理のみ行う):
true
アンカー削除:
false
1115
:
名無しさん
:2024/11/01(金) 02:17:24
過去ログに関しては2ch.scとそれ以前のログはみみずんに随分助けられてますね
みみずんに関しては最近のブラウザではhttpsに強制されるせいで
httpでしか見れないみみずんが見れなくなったと思ってる人も多そうで
新着レスの表示
名前:
E-mail
(省略可)
:
※書き込む際の注意事項は
こちら
※画像アップローダーは
こちら
(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)
スマートフォン版
掲示板管理者へ連絡
無料レンタル掲示板