NET/日経新聞電子版
の編集
https://over.6pb.info/wiki/?&e1d93f247e
[
トップ
] [
編集
|
差分
|
履歴
|
添付
|
リロード
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
]
-- 雛形とするページ --
(no template pages)
***図表の中のテキストを検索できない [#zuhyotext] 「2010年活躍した弁護士ランキング」(2010/12/24付日本経済新聞 朝刊)に名前が載れば検索できるだろうか。意外にもできない。名前は表に一覧されているが,表の中のテキストは記事検索の対象になっていない。例えば久保利英明氏(6位)や葉玉匡美氏(7位)は検索上は選外である。記事本文に名が出た少数の人を除き,紙面のランキング上位1桁に名前が出ていても検索できない。(本文に全員の名前を出すなら,表は要らないし,それではきわめて読みにくい記事になる。)検索されなければ存在しない,はネットの負の側面だが,それが日経にもある。「%%%ボスの名前が出ていない%%%」は早合点かもしれない。 -東京・首都圏経済面の「首都圏けんてい・どこでも探検隊」は「けんてい」(検定)を記事の特徴にしている。検定問題が出される。しかし,「朝刊・夕刊」では検定部分(課題)は画像になっており,そのためか,記事検索でも課題文を引くことはできない。テキストデータとしては記事データベースにも載っていないのかもしれない。 -「朝刊・夕刊」で,ごく普通の見出しをクリックすると,いきなり画像に飛んだこともある。記事全体が一つの表の場合,全部が画像なのでそういう次第になったのだろう。この場合,一つの記事が丸々記事検索の対象外ということになる。2011/1/4付朝刊の「小売店からみた『これが売れる』 本社調査」。記事検索では,見出しで引くことはできるが,記事属性を見ると本文が全くないことを示唆する状態になっている。 まとめれば,紙面では表の中だろうが,本文であろうが,文章は文章であるが,記事検索では図表の中か本文かで扱いが異なる。ただ,この問題は日経電子版ではなく日経テレコンの問題だろう。 -図表は本文の理解を助ける単なる補助ではない。本文に内容を書き出すと箇条書きになってしまうのを避けて一覧にまとめたケイスが過半ではないか。会社名が表の中にしか出てこないこともある。その場合,記事検索して「%%%ウチの会社は日経に載っていない%%%」は早合点になる。 -仮にデータベースを接続して検索できるようになっても,検索漏れは残りそうだ。例えば「ノーベル平和賞授賞式の欠席国」という表(電子版ではHTMLで組まれている)のテキストは「中 国」,「ロ シ ア」と空白が入っている。「中 国」は間に2つも。画面上の見た目を''少しでも''改善しようという健気な意図だろう。エディターはマークアップ言語という概念への理解を欠くし,自分でHTMLを書いた経験も非常に乏しいのだろう。 図表は「朝刊・夕刊」では基本的に画像で表示されるが,前述の通り,ウェブ版に同じ記事が掲載された場合は,図表がHTMLのテーブルで組まれていることがしばしばある。しかし,たとえウェブ版でHTMLのテーブルで組まれていても,次のいずれにおいても記事検索の対象となっていないようだ。(1)「朝刊・夕刊」のコンテンツがWeb刊等に表示されている場合((実際はこの場合は画像のままか表が削除される。)),(2)「朝刊・夕刊」と同一記事だが本籍はウェブ版である場合(属性表記が「電子版」になっている場合が典型),(3)そもそも電子版独自コンテンツ。内部のデータベース上の属性で「表」になっていれば,画面上に最終的に画像として表示されていようがテキストとして表示されていようが記事検索の対象とならないようである。 -「活躍した弁護士ランキング」は「日本経済新聞朝刊連動」と称して電子版(ウェブ版)の「マネー・マーケットonline」にも掲載された([[タイムリー・ランキング:http://nvmol.nikkei.co.jp/features/36.aspx]])。紙面に「各部門のランキング詳細を電子版『マネー・マーケットonline』に。」との一文があるのを受けている。続きはウェブでの類。ところが,「朝刊・夕刊」にはこの案内は全くないし,リンクも全くない。紙面と電子版の連携は存在するのに,電子版同士の連携が存在しないケイス。電子版内の縦割り。さらに,「マネー・マーケットonline」は日経電子版の下にはあるが独立の別メディアのようであり((そもそも「日本経済新聞朝刊連動」という呼称は他人行儀である。)),色々挙動が違う。例えば記事検索の対象になっていない。紙面にはランキングの一部しか載っていないが,電子版には25位まで載っている。しかし,結局,記事検索では検索できないのである。
タイムスタンプを変更しない
___paraedit_taxtarea___
テキスト整形のルールを表示する