したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | メール | |

管理人の独り言(プログラミング関連)

616774さん:2008/10/16(木) 16:32:22 ID:CENbthlg0
ブログとかで配信しているRSSは全文を配信していない。
大抵、続きを読むが出るところまでか、前何文字とかそんな風である。
前者の場合は、ブログの管理人が続きを読む機能を知らないで使っていれば、全文と同じである。
だが、後者の場合はほぼ確実に全文ではなくなる。
どちらにせよ全文を表示できない可能性が十分にあるので、あまり美味しくない。
つまりどうせならばRSSリーダーで全文を読みたい、保存したい。と言うことだ。

さて、どうすれば良いか。
RSSにはそのページへのパーマリンクがまず含まれている。
よって、そのページに行けば確実に全文が含まれているだろう。
そして、大抵のサイトではデザインが同じはずなので、何処の要素に本文の全文があるかが分かれば良い。
つまり、サイトごとに何か要素を指すものを作ればいいわけである。(これはXPathでも良いし、独自の方法でも良い。)
しかし、その情報を一体どのように入手するか、保存するかが問題である。

これにはもう前例があって、AutoPagerizeやLDRize等で利用しているSiteInfoという手が一番美味しいと思っている。
つまり、使用者全員で作る巨大データベースと言うことである。
これならば個人が参照方法を考えなくても良くなるし、負担が減るであろう。

実はまず、この全文受信したいと思っている要望時点に問題があって、全文を手に入れるには必ず一時サイトに接続しなければいけないという問題である。
その本文を読まないのに、そのページを取得しに行く。そしてそのサーバーに負担がかかる。
まあ、此れには全文を保存するキャッシュサーバーを用意するという手が考えられる。
ある意味でのプロキシである。
まあ、そのプロキシは誰が設置するんだという問題があるだろうが、それはどうにもならない問題である。
よって、この計画は駄目であるということだ。


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板