NET/日経新聞電子版
の編集
https://over.6pb.info/wiki/?&e1d93f247e
[
トップ
] [
編集
|
差分
|
履歴
|
添付
|
リロード
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
]
-- 雛形とするページ --
(no template pages)
***続「ワードロボ」 取りこぼし [#z5e076fe] 取りこぼしの典型は,ある記事のキーワードを引いたらヒット0になった,という挙動である。本来なら少なくとも自分自身は出てこなければならない。もしその記事が「朝刊・夕刊」とウェブ版(電子版)の両方に掲載されているのならば少なくとも2本は出てこなければならない((偶々文章のずれを突いた稀少な場合を除き。))。ヒット0ならおかしいと気づくが,そうでなければ取りこぼしに気づくのは困難だ。さらに言えば,偶々データベースの更新が遅れただけのこともあるのかもしれないが,それでは説明が難しい例もあった。「盆栽」というキーワードがある記事に付いていたので引いたら0になったことがある。翌日もそうだった。ところが,翌々日になると,自分自身2本(紙面とウェブ版)の他に多数の過去記事が出てきた。偶々データベースの更新が遅れただけなら,直近の記事が出てこないだけのはずである。また,0になるときでも,複数付いているどのキーワードでも0になるわけではないようだ。0にならないキーワードには自分も出てくる。これはデータベースの更新遅れ説に不利である。また,0になるキーワードを記事検索で引いたところ,元記事は出てきた(サンプルが少ないので,おそらく常に出てくるのか,出てこないこともしばしばあるのか,等までは不明。)。 -キーワードに空白が含まれていると基本的に0になるようだ(補足あり)。バグだろう(キーワードが空白を含むことを想定していない)。例えば,「元気な山村 岐阜・加子母に住んでみる」という連載があるが,これに付いているキーワード「元気な山村 岐阜・加子母に住んでみる」(連載名と同じ)はヒット0になる(2010/12/7 AM 10:11確認)。なお,記事検索で「元気な山村 岐阜・加子母に住んでみる」を引くと,全文検索では全て出てくるが,キーワード検索では取りこぼしが幾つもある。 --ある記事のキーワード「エコカー電池 始まった争奪戦」(それとは別に「エコカー電池」も付いていた)を引くと,実際には「エコカー電池」で検索された(ワードロボの画面でそうなっていた)。空白以降が脱落。これは別のバグだ。ただ,他の理由でも「元気な山村 岐阜・加子母に住んでみる」と差が出ているのかもしれない。連載記事・コラムは,連載名が「朝刊・夕刊」上では画像で表示されており,このため全文検索の対象から外れる,というバグがあるかもしれない(未確認)。「エコカー電池 始まった争奪戦」がバグにより「エコカー電池」で検索された場合は記事本文のどこかにマッチする可能性が高いが,「元気な山村」は本文にはマッチしないことが多そうだ。 --「S&P500種株価指数」で引いたら「Sの関連語はありませんでした.」。&以下は無視されたようだ。「M&A」も同じく。&はstop wordsなのだろう。だがそういう仕様がエディターに理解されていないし,そもそも設計ミスではないか。 --「STOCK α」は連載名としては空白が入るが,キーワードは「STOCKα」。それでワードロボで漏れなく拾えるようだ。また,「STOCKα」で,見出しのみを検索範囲に,完全一致で記事検索した場合も,漏れなく拾えるようだ。文中の空白は無視される? -連載やコラムで,キーワードに連載名,コラム名を含まない場合,兄弟記事に移動するにはワードロボは使えず,記事検索を使う必要がある。いわば,兄弟は自分を見つけてくれるが,自分から兄弟を見つけることはできない。 --Evernoteにクリップする際,連載名・コラム名をテキストでクリップしたいなら(全文検索のためにはそうすべき),その記事をワードロボで開いてそれをクリップする裏技がある(しかし限界もある。後述。)。
タイムスタンプを変更しない
___paraedit_taxtarea___
テキスト整形のルールを表示する