したらばTOP ■掲示板に戻る■ 全部 1-100 最新50 | メール | |

質問スレ

473名無しさん:2023/06/21(水) 20:07:26 ID:.39TZbu.
アルファポリスに何とか対応できないものかと必死にyaml書いてるねんけど、
タイトルは正常に取得できるようになってもなぜか作者名の取得がにっちもさっちもいかん...
詳しいニキネキ、問題どこにあるかわかる?
ruby も yaml も初心者過ぎて何故こうなるのか全く分からん...
yamlはkakuyomuのを流用してる。

現状のyamlで取得しようとすると目次が取得できない + 作者名が正確に取れない <- 今回の解決したいとこ

ほんで実際に 書き出される作者名は
<div class="author">[\s\S]*?<a href="/author/detail/(作者ごとの数字)">(?<author>.+?)</a>
になってしまってる。


以下見せるのも恥ずかしいぐちゃぐちゃ改造yamlファイル

# ------------------------------------------------------------
# 小説サイト定義
name: &name アルファポリス
scheme: https
domain: www.alphapolis.co.jp
top_url: \\k<scheme>://\\k<domain>
url: \\k<top_url>/novel/(?<authorid>\d+)/(?<ncode>\d+)
encoding: UTF-8
confirm_over18: no
append_title_to_folder_name: yes
title_strip_pattern: null
sitename: *name
version: 1.0

# ------------------------------------------------------------
# 書籍情報取得設定
title: &title |-
<h1 class="title">\s*(?<title>.+?)</h1>
#最優先課題、なぜか
author: |-
<div class="author">[\s\S]*?<a href="/author/detail/\d+">(?<author>.+?)</a>
story: &story |-
<div class="abstract">(?<story>.+?)(?:[\n ]*?</div>)
# ------------------------------------------------------------
# 目次取得設定 エラー発生中 いったん無視
toc_url: \\k<top_url>/novel/\\k<authorid>/\\k<ncode>
subtitles: |-
(?:<div class="episodes ">
<h3>(?<chapter>.+?)</h3>
</div>
)?<div class="episode ">
<a href="(?<href>/novel/\d+/\d+/novel/(?<index>\d+))".*?>
<span class="title"><span class="bookmark-dummy"></span>(?<subtitle>.+?)</span>
</a>
<span class="open-date">(?<subupdate>.+?)</span>
</div>

# ------------------------------------------------------------
# 本文取得設定

body_pattern: <div class="text " id="novelBoby".*?>(?<body>.+?)</div>
introduction_pattern: null
postscript_pattern: null

# ------------------------------------------------------------
# 小説情報からパースするための設定
novel_info_url: \\k<toc_url>

# タイトル
t: *title

# novel_type 小説種別
nt: <div class="content-info gray-menu section"><div class="content-statuses"><span class="content-status complete">(?<novel_type>.+?)</div></div></div>
novel_type_string:
連載中: 1
完結: 3

# story あらすじ
s: *story

# general_firstup 初回掲載日
gf: <table class="detail"><tr><th>初回公開日時</th><td>(?<general_firstup>.+?)</td></tr></table>

# novelupdated_at 小説の更新時刻。最終掲載日で代用
nu: <table class="detail"><tr><th>更新日時</th><td>(?<general_firstup>.+?)</td></tr></table>

# general_lastup 最新話掲載日
gl: null

# writer 作者名
w: |-
<div class="author"><span><a href="/author/detail/\d+">(?<writer>.+?)</a></span></div>

# length 文字数
l: <table class="detail"><tr><th>文字数</th><td>(?<length>.+?)</td></tr></table>


新着レスの表示


名前: E-mail(省略可)

※書き込む際の注意事項はこちら

※画像アップローダーはこちら

(画像を表示できるのは「画像リンクのサムネイル表示」がオンの掲示板に限ります)

掲示板管理者へ連絡 無料レンタル掲示板