Table of Contents

このページは日本経済新聞電子版(nikkei.com)を取り上げている。 http://over.6pb.info/nikkei-wiki でこのページに直接アクセスできる(直通)。初出:2010/11/07頃。2011年に入ってからは部分的にしか更新していないので内容は古くなっている。文中,各社の商標はそれぞれ各社に属する。

電子版に一番期待することは? Edit

Q:電子版に一番期待することは?

A:紙面をスクラップする代わりになること。人類は長年,新聞を保存するため紙を切り抜いてきた。技術の進歩の恩恵を受けたい。端的にはEvernoteに保存したい。

よい点 Edit

コピペ自由 Edit

コピペに(技術的)制約が加えられていない(つまりコピー&ペースト自由)。本文をごく普通のテキストとして取り出せるし,記事中の写真・図版も同様。有料,無料会員問わず。(なお,コピペが技術的に自由だとしても法的に自由かは別問題。)このためEvernoteにも何の不都合なく取り込める(どのページでも取り込める。「朝刊・夕刊」を含め。)。

Evernote余話 Edit

日経の記事をEvernoteに取り込むにあたっては,AutoPagerizeがブラウザーに入っていると便利。日経に限らないが,一つの記事を複数のページに分割しているサイトは多い(それが主流だろう。)。単に閲覧するだけでもページめくりは面倒だが,Evernoteに取り込む際はさらに面倒になる。AutoPagerizeはページを自動的に連結して一つのページとして表示してくれる。詳細はAutoPagerizeを。

朝日新聞は身勝手 Edit

「朝日新聞デジタル」(朝日新聞電子版)が始まった。初日に早速契約したが,不満もある。2011年 5月20日


以下は「朝日新聞デジタル」が始まる前の記述。当面,残しておく。

朝日新聞の記事をEvernoteに保存するのは非常に難しい。

まずasahi.comは対象として不適格。紙面の一部しか載らないので,欲しい記事が載っていないことの方が多い。載っていても,かなり省略されているので肝心の部分が欠けていることが多い。別のメディアである。

次に,「アサヒ・コム パーフェクト Fullコース」という一見,日経電子版と似た利用形態があるが,根本的問題がある。これは契約上,コンテンツの私的コピー(著作権法30条)すら許さないようである。(ちなみに,大学内では「朝日新聞 聞蔵IIビジュアル」というもっと便利なものが使えるが,法的制約は変わらない。)さらに,「アサヒ・コム パーフェクト Fullコース」は日経電子版の「朝刊・夕刊」の内,朝刊しかない。そもそも,「アサヒ・コム パーフェクト」は記事検索のサービスであり,新聞をウェブで見ることを狙いとしたものではない。

朝日は記事を新聞社の私物と考えているように思える。この20年で世の中は随分進歩した。過去数百年,人類は,紙を切り抜かないと新聞を保存することはできなかったが,技術の進歩によりEvernoteが登場した。しかし,朝日新聞の消費者は技術の進歩の恩恵を享受できない。技術が進歩するとむしろ不便になる,という「駄目な日本」の好例である。

自律的に朝日新聞その他が変わることを期待してもしょうがないから,朝日新聞その他に,変わるインセンティブを与えることが必要だ。さて,具体策は?

対等な2つのメディア Edit

さて,紙面とウェブ版の両方に掲載されている記事は,どちらも同一内容が原則のようだ。日経の明確な方針は分からないが,例えば朝日新聞ではウェブに載る記事は紙面の同じ記事の短縮であることが多く,逆に紙面より長いことは(「続きはウェブで」の類を除き)私が気がついた範囲では存在しない。言うなれば,朝日は紙面中心である。建前としては,紙面とウェブでそれぞれエディターが違うから,元の記事は同じでも,どういう文章にするかはエディター次第ということなのだろう。(識者コメント(社会面の記事でよく見かけるあれ)が朝日のウェブに基本的に載らないのも,著作権上の理由からであり,省略ではないのかもしれない。)しかし,常に短くなるのは不思議である。エディター云々は建前であり,基本方針は紙面の短縮が(無料の)ウェブ版という方針ではないか,そう推知させる挙動になっている。これに対し,日経電子版では特に主従の関係はないようだ。むしろ,紙面(東京最終版)にない記述がウェブ版に加わっていることもよく見かける(内容の実質的追加のみならず,分かりやすくする語句を補うこともよく見られる。)。まさにエディター次第を推知させる挙動である。

では,ウェブに無料で載る記事が紙面の短縮である(朝日流)のはけしからん?私はそうは思わない。問題は,少なからぬ消費者が,新聞は無料でウェブで読める,ウェブに載っている記事は紙面に載っている記事と同じである,紙面に載っている記事の(全てではないにせよ)大半がウェブにも(無料で)載っている,と誤解していることだ。実際は両者の関係は個々の新聞社の方針でまちまちである。読者のこの誤解があるにもかかわらず新聞社は誤解を見て見ぬ振りして短縮記事を載せ続けており,このことが,新聞に購読料を払わない(払いたくない)人にますます払わない方向のインセンティブを与えている。情報格差,貧困化の一側面と言うべきだろう。彼らは自分で自分の首を絞めているのだ,と言うことは,国民経済の観点からは適切ではない。労働者の質を平均的に低める。また政治的にも危うい。たとえ日経や朝日がしばしば馬鹿げた(偏った)記事を書くとしても,新聞がない世の中になるよりは遙かにましである。自分にベストの新聞がないから既存の新聞は一切要らない,は幼児的である。我々は,ベターな新聞に対して適切なコストを払わなければならない。さもないと民主政を維持できない。日経はウェブ版を有料化した。只で見ることができる情報は,情報全体の一部である,という明確なメッセージを消費者に送っている。これは経営的には大きな賭だが,民主政という点では好ましい方向と私は考える(成功するかはいまだ流動的だし,他にもやり方があるだろう。)。

紙面とウェブの内容がまちまちになる,しかもほとんど同じで細部のみ違う「かもしれない」。――これは必ずしも欠点ではない。電子メディアが紙に制約されるのは不自然であり,まちまちを前提に我々はそれを使いこなしていくことになるだろう。面積の制約のある紙面に合わせて電子版の背丈が削られるのはおかしい。以下,そういう話になる。言い換えれば,2つのメディアが対等であることの利点は大きいので,欠点(内容が微妙にバラバラになる。ひいては,読者は「朝刊・夕刊」のみならず,Web刊の同じ記事もよく見ないと,しかも更新を随時確認しないと,記事の細部を取りこぼす。)は別の方策で補う,と考えることになる。記事同士のリンク(関連記事)などが使えるだろう。いま見ている記事や,過去に見た記事等から,各人に合ったお勧め記事を的確に提案する仕組みが鍵になる。ただし,お勧めがメールなどでばらばらと送られてくるより,何か記事を開くと,そこから芋づる式に読み進められるような仕掛けの方がスマートだろう。送られてくるお勧めの羅列を数時間おきに見させられると,とても疲れる。押しつけがましい。自らの関心に導かれるまま先に進んでいるような演出になっていると嬉しい。

記事がウェブで先に公表され,紙面があとになることはごく普通のようだ。速報系の内容なら当然であり,特筆するようなことではない。特集のような,速報系ではない内容の記事でも先に(つまり前日夜に)ウェブ版に出ることもある。

なお,電子版(「朝刊・夕刊」とウェブ版を含む広い意味)のコンテンツを見る場所は,「朝刊・夕刊」やWeb刊等だけではなく,例えば,「自動記事収集」,「おすすめ」,「保存」等にも広がっている。(「My日経」という名前が付いている。)色々なアクセス手段がある。しかし,このどこで見ても「同じ記事なら同じ」に見えるわけではない。例えば,「おすすめ」等では外信の写真は基本的に削除されるようだ。版権上の理由だと思われる。後述版権参照。

電子版にしかない記事を探そう Edit

紙面にはない,電子版(ウェブ版)独自の記事も少なくない。実際はかなり多い。電子版の購読料が高いか安いかは議論があるが,紙面に載っていないコンテンツも非常に多いことは一つ覚えて置いた方がよい。ただ,「独自」にも幾つか性格の違いがあり,日経の主要購読層(部課長クラス)にとって魅力的なものもあれば,そうでないものもある。いまは日経側でも方針の整理が付いていない段階のようだ。なにしろ,「これは独自コンテンツです」という印すら現状では特にない。

日経を読み慣れていれば,すぐ独自であることに気づくコンテンツも多いが,そうではなく,何日か(あるいは1週間ほど)経ってから「あれは独自コンテンツだったのかもしれない」と気づくものもある。さらには,日経本紙に載っても全くおかしくないのだが,結果的に「紙面には載らなかった」記事(いわばボツ記事)も少なくない。日経の主要購読層(部課長クラス)は,狭義の独自コンテンツよりも,「ボツ記事」に一番関心があるのではないか。例えば,紙面なら企業面に載るような個別企業についての少し長め(800字前後)の記事(ロイターと同類。日経QUICKニュースとも同類だが,それとは別記事。)で,「ボツ」になったものもかなり多そうである。そうした記事は,たまたまその日,Web刊で目にするのでなければ,後日,キーワード検索や「関連記事」(電子メディアならではの記事同士の連携。後述)で拾われるまで埋もれているのだろう。しかし,そうは言っても,ボツ記事(候補)も含めてくまなく電子版に目を通すのは非効率的というか,馬鹿げている。そこは電子メディアの特性を活かした工夫の余地がある。例えば,記事同士のリンク(関連記事)の工夫(前述後述。)。《昨日の独自コンテンツ一覧》(後述)も一案。日経電子版の営業部としては,埋もれている記事にスポットを当てる企画や仕掛けが必要になる。メディアの特性を活かして読者の負担を軽減すべきだ。

逆に,紙面(と「朝刊・夕刊」)には載ったがウェブ版には載らなかった記事はどれくらいあるのだろうか(小説など「朝刊・夕刊」にも載らなかったものは除く。版権絡みでウェブ版には出てこない記事もあり(後述),それも除外してよいだろう。)。待て待て,ウェブ版に出なくても,基本的に全て「朝刊・夕刊」には出ているのだから,このような問いはそれほど意味はなさそうにも思える。しかし,そうとも言えない面もあるのだ。

まず,「朝刊・夕刊」には出ないウェブ版独自の記事も少なくないので「朝刊・夕刊」だけを見ていれば足りるわけではない。他方,「朝刊・夕刊」の記事の多くはウェブ版にも出てくるので,ウェブ版を随時見て,その上「朝刊・夕刊」も見ると実際にはかなりの部分は重複作業になる。こうした中,「朝刊・夕刊」にしか出ない記事がどれくらいの割合かという数字は,読者の行動に影響を与えるだろう。例えば,8割は出るのなら,「朝刊・夕刊」に目を通す優先度を下げるかもしない。これは各人の選択である。8割は出るのなら,逆に出なかった記事一覧,即ち《「朝刊・夕刊」には載ったがウェブ版には出なかった記事の一覧》が翌日「My日経」に出ると便利だろう。さらには,《紙面の記事がその後,電子版で補充されたもの》一覧,なども便利だろう。さらに言えば,《今日の「独自」コンテンツ一覧》ないし《昨日の「独自」コンテンツ一覧》も便利だ。ちなみに,日経電子版が始まる前の「日経ネット」の時代は,全記事の3割程度しかウェブに載せていなかったそうである(朝日新聞web2010年2月24日23時30分)。

その他よい点 Edit

いまいちな点 Edit

一方通行 Edit

この記事は面白かったので,この種の記事を今後も掲載して欲しい,という意思を簡単に新聞社に伝える手段がない。後述するように,「問い合わせ」は非常に敷居が高いし,読者は暇じゃない。記事にボタンが付いていれば全てが解決する。なお,他の読者に伝えたいわけではない。新聞社や記者に伝えたいのである。

日付がない(朝刊・夕刊) Edit

「朝刊・夕刊」の個々の記事に日付がない。紙面の体裁を踏襲したのだろうが,Evernoteなどでクリップした際,いつの記事なのか後日分からなくなる。そもそもこれは紙面の時代からずっと,多くの人が悩んできたことのはずだ。新聞記事(紙の)を切り抜いた際,その日付・出典をどう書き添えるか(何新聞のどの面か。もしかしたら日経の北海道版かもしれないし,同じ東京版でも毎日,複数の版がある。)。切り抜きをしたことがある人なら必ず悩んだことがあるはずだ。紙版ではこれを新聞社側で改善するのはハードルがやや高いかもしれないが,電子版なら容易だ。それなのに新しいメディアの特性を活かしていない。と言うか,「朝刊・夕刊」以外には日付が入っているのだから後退している。読者目線に欠ける。

URLが一定しない Edit

同僚に「このページを見て」とメールにURLをコピペして教えても,相手はそのページを開けないことがある。相手も契約者であっても。……相手が開こうとすると,「ただいまの操作はお受けできませんでした。電子版トップから再度操作してください。」と拒否される。この通知は意味不明だが,種明かしすれば,URLがone-timeだったので開けなかったのだ(そういう場合にこの通知が出る)*4。各記事の下に出てくる関連記事や,関連キーワード(ワードロボ)を介して開いた記事がそうなる。(ならないこともある。条件不明。)他にもあるかもしれない。関連記事をたぐることは非常に多いだろうし,リンクは電子メディアの大きな特長である。そうして開いたページを同僚・知人に教えることができないのは,非常に不便である。

これはワードロボ(や関連記事)という特別な仕組みを介したからそうなっただけ?極端な例?そうであるとよいのだが,日経電子版は,記事をURLで特定することにどこまで重きを置いているか甚だ疑問だ。例えば,新着記事は「トップ > 記事」というカテゴリーでWeb刊に出てくる。URLもこのカテゴリーを反映している。同じ記事を「経済」等のジャンル分けに入ってから開くと,「トップ > ニュース > 記事」になる。URLもこの階層を反映したものになる。どこから開いたかでURLが変わる。また,「トップ > 記事」の記事の下に付いている関連記事を開くと,記事のカテゴリーは「トップ > 記事 > 関連記事」に変わる。URLもこれを反映したものになる。如何にも仮のURL(カテゴリー)という匂いを漂わせている。また,新着記事は「トップ > 主要ニュース一覧 > 記事」というカテゴリーで出てくることもある。URLもこれを反映したものになる。その記事の下に付いている関連記事を開くと,記事のカテゴリーは「トップ > 主要ニュース一覧 > 関連記事」に変わる。その記事は,いまは「主要ニュース一覧」の関連記事から開いたが,もとは「トップ > 記事」にいたのだろう。その記事の本籍がどこかではなく,いまどのような経路で呼ばれたのかによって相対的にURLが決まるのである。

URLが一時的・使い捨てなのは論外だとしても,日経電子版のURLはこのように浮動的である。否,一時的・使い捨てURLは,実は浮動的URLの素直な発展系であり,プログラム的には自然な延長とすら言いたくなる。どちらも,プログラムが(内部の法則で)記事を生成・表示できればよいという発想では同じであり,外部から記事がどう特定されるかは二の次である。日経のシステムは,記事を記事固有のURLで特定するという発想を欠いているのである。冒頭の例,「ワードロボの記事は,他人は開けない」は,特異ではない。記事をURLで特定することに冷淡という日経電子版の発想に沿っている。しかし,記事は固有のURLを持つべきである(OpenURL)。

記事のURLは,新聞社にとっては自社システムの延長であり,自社が自由にできるものと考えるだろう。しかし,その新聞がメディアとして社会の信頼を得れば得るほど,URLも公のものになっていく。一旦記事が発表されると,多くの人が長期にわたり,記事固有のURLで(記事固有のURLがあることを前提にそれで)その記事を引用・参照するようになる。ある人が「My日経 > ワードロボ > 記事」を見てその記事を友人に紹介した場合も,別のある人が「> ライフトップ > 暮らしの知恵 > 充実生活 > 記事」を見てその記事を友人に紹介した場合も,同一の記事なら同一のURLでないと,話が混乱する。ましてや,一時的・使い捨てのURLなどもってのほかである。同一の記事は固有・単一のURLを持つことが社会的に求められるようになる。日経電子版はURLの持つこの重みを未だ理解していない。それは日経電子版のメディアとしての地位が低いこと(期待されていない)の反映と見ることも可能である。電子版のシステムを外販する(それくらいの意欲は欲しい。)場合も不利だ。

なお,分類をしないコンテンツ管理が近年主流になりつつあり,日経電子版でURLが一定しないのもその反映と見る余地もある。しかし私は,分類を固定せよと言っているのでなく,URLを固定せよと言っている。但し,新聞が記事を1面に載せるか企業面に載せるかは,それ自体も大きな価値を持つ(価値を生む)。そこにはエディターの選択眼が反映している。それが新聞というメディアの特徴の一つだ。我々は単に断片的情報に金を払っているのではなく,エディターの選択眼にも金を払っている。電子化したらそれ(収入源の一つ)をばっさり捨ててしまうのは勿体ない。現状は,分類があるような,ないようなという中途半端な状態。URLが固定しないのも,背景には方針が定まっていないことがあると推測する。

被引用 Edit

URLが浮動的だと被引用(例えば,記事がどれほど引用・参照されたか)を辿るのが難しくなる。日経自身はサーバーのアクセスログを元に,分析業者に被引用数を推計させることができる。しかしその数字がどれほど実体に近いのかはなかなか難しい問題である。基本的に被引用数はかなりあやふやな推計に基づいている。そして,URLが浮動的であればあるほど数字の検証が困難になる。広告媒体として価値を高めるには数字の偏差を小さくしなければならない。しかも,被引用数なら推計で足りるが,内容を追うには推計ではすまない。内容を追うには浮動URLは非常に不利である。

ある記事にコメントを付けてtweetする。同一記事に他人もコメントを付けてtweetしている。同一の記事をめぐり,他人のコメントを見るのは中々面白い。記事を書いた記者本人も気になるだろう。被引用の活用例。Topsyなどがその種のサービスを提供している(twitter.comにも具わっている*7。)。Topsyなどは「同じ記事」をURLをキーに集約している。URLが違えば別の記事になるので,コメントを共有するのが難しくなる。

日経電子版では,記事の表示されている場所(カテゴリ)は同じなのに,URLの途中が異なることもある。そういう場合も,Topsyなどからは別の記事とカウントされる。

紙面は孤高にして連携は途上。 Edit

「詳細はウェブで」の類は世間並みによく利用されているが,それ以上の連携はまだ途上。「関連キーワード」(ワードロボ)で無理やりつないでいる段階。例えば,「宮内庁調査官が明かす『896の聖域』 天皇陵の真実」という記事が電子版(ウェブ版)に載っている(2010/11/27 4:00)。同日朝刊の「古代史解明の鍵 『陵墓公開を』強まる声」(2010/11/27朝刊)に連動したものだろう。しかし,「朝刊・夕刊」には,ウェブ版のこの記事へのリンクはない。勿体ない。

日曜朝刊に「日経新聞電子版 閲読ランキング」が載る。「朝刊・夕刊」上では電子版の各記事へのリンクになっていてよさそうなものだが,なってない。紙と変わらない。「朝刊・夕刊」の外にはリンクを貼らない方針?潔癖だ。(「朝刊・夕刊」の記事本文は,紙面の記事データベースの制約を強く受けるのだろう。紙面にないリンクを「朝刊・夕刊」に出現させるわけにはいかない,と。システム設計が硬直的ではないか。)しかも,この記事の関連記事欄にも各記事へのリンクはない。電子メディア同士なのに,どうあがいてもリンクをたどれない。なお,他の記事と同じく,「類似している記事(自動検索)」一覧はあるが,自動検索はランキング記事を的確に網羅するほど賢くないし,後述する大きな制約もあるので,この場面では全く役に立たない。

逆に,電子版から紙面(「朝刊・夕刊」)への連携も足りない。例えば,2010年11月16日朝刊経済2面の「今年度GDP実質2.3%増 NEEDS予測」という記事を見ると,紙面では表があるが,ウェブ版(2010/11/15 18:51電子版)ではない。ウェブ版は統計表の内容を本文の文章に取り込もうとしていた。しかし,表の内容のごく一部しか拾えていない。そもそも数字の表を文章にされても読者は困る。だから表がある。しかも,「詳細は『朝刊・夕刊』または紙面を」という誘導もなかった。ウェブ版の読者は,紙面にはきっと表があるはずと察しながら読む必要がありそうだ。

さらに,「朝刊・夕刊」内の,一つの記事の中での連携も不十分である。紙面を読んでいると,欄外注記(「キーワード」という名前)が付いている記事がある。本文では,対応部分はゴシック体(紙面)になっており,鍵の印が付いている。キーワード欄を見よ,というわけである。ところが,「朝刊・夕刊」では単にボールドになっているだけで,リンクも何もない。紙面の体裁を知らないと,なんでボールドになっているのか分からないし,下に「キーワード」なるミニ解説が付いていることにも気づかないだろう。自分達の資源を生かし切れていない。

「類似している記事」 Edit

「類似している記事」という名の自動検索技術で関連記事へのリンクが(自動的に)一覧される。だが,「朝刊・夕刊」とウェブ版(Web刊等)とで挙動が異なる。「朝刊・夕刊」の「類似している記事(自動検索)」欄には「朝刊・夕刊」の記事しか出てこないようだ。他方,ウェブ版の同欄にはウェブ版と「朝刊・夕刊」の両方の記事が混在して一覧される。無論,後者のほうが優れている。現状,「類似している記事」の連携システムは一方通行のようだ。「朝刊・夕刊」から外へはリンクを貼らない方針?

さらに違いがある。ウェブ版では「類似している記事」には過去記事のみならず,未来方向の記事(いま見ている記事の後に出てきた記事)も出てくる。他方,「朝刊・夕刊」では過去方向のみのようだ。いわば,新聞発行時点で固定される。これはこれで一つの方針だが,勿体ない。とりわけ被引用(自分を引用した記事へのリンク。未来方向。)をたどれると事件のその後の展開を追いやすいので便利だし,この,被引用をたどるという行為は,紙メディアではできず,電子メディアならではの特技だ。それを捨てるのは勿体ない。引用と被引用の両方に移動できることが望ましい。そもそも,現状は,類似しているという自動検索により未来方向や過去方向に動けるだけであり,被引用や引用をたぐっているわけではない。

自動検索なので,漏れもある。連載の過去記事が一覧されているが,連番の一部が欠けているなど。例えば,2010年11月22日から社会面に「工場へ行こう」という短期連載が載っている。電子版(「朝刊・夕刊」)の第3回の記事からリンクをたどって第1回の記事に行くのは簡単だが(正にそのリンクがあるから。),第3回から第2回へは簡単ではない。「類似している記事(自動検索)」に第2回は出てこないのだ。

理想は芋づる (ワードロボ 他) Edit

紙面(「朝刊・夕刊」)とウェブ版との連携,に限定せず,電子版同士(特にウェブ版同士)の連携に話を広げる。

ウェブ版(電子版)と紙面には,どちらか一方にしか載っていない記事,両方に全く同一の文章が載っている記事,両方に載っているが細部が微妙に違う記事,しかもどこが違うかは,読んでみないと分からないし,読んだだけでは分からないことも多い,など多数の記事が溢れている。情報洪水である。しかし,これ自体は慶すべきことだというのは前述した通りである。幸い,関連記事などの仕掛けを用いて,我々は記事を読む負担を大幅に減らすことができる。ウェブというプラットフォームの恩恵である。ウェブの果実を受け取らない手はない。

常識的には,全ての記事に目を通すのは不可能であるし,非常な苦痛だが,関連記事の作りがうまければ,読者の負担を大幅に減らすことができるし,耐えて全てを読む必要もなくなる。いま全てを読まなければ失う,という不安から人類は解放され,読みたいときが読み時になる。関連記事はそういう役割を担っている。さて,現時点で,日経電子版の各種の「関連記事」の仕掛けがその任に応えているかと言えば,残念ながら否である。おそらく,日経の側でも方針が見えていないのだろう。我々から提案していく必要がある。このページもそういう意図で作られている。

ところで,記事同士にリンクを貼るのに自動検索技術を使えば人件費を抑制できる。しかし,面白みがない。例えば,「新防衛大綱『動的防衛力』を提唱 中国に警戒感」(2010/12/5 22:10電子版)ならば,その先週に掲載された「やさしい経済学 多国間協調のゲーム理論」(岡田章・一橋大学教授執筆)へのリンクがあってもよいだろう。若い読者を紙面に誘う(ひいては購読者にする)には,地道に仕掛けを蒔き続けるしかない。リンクを貼ることは人を育てることでもある。また,エディターとロボットの違いを出せる場所でもある。例えば,「スターそろう『当たり年』なぜあるの?」(日経プラスワン2010年12月4日)の関連記事に経済教室の「空間経済学への招待」(佐藤泰裕・大阪大学准教授)を入れる遊びができるのは,ロボットではなくエディターだろう。

「ワードロボ」 Edit

ワードロボは,キーワードによって,その場で全文検索する仕掛けのようだ。最初はもっと賢いものかと思ったが……。各記事にはエディターによって事前にキーワードが付与されているが,そのキーワード同士の一致を見ているのではない。エディターは記事に付けるキーワードを決めているが,その先は全文検索プログラムに委ねられている,と思われる。そして*8,字句の一部分にマッチして,不適切な記事が一覧に出てくることもしばしばある。「ローランド」で引いて本文に「トゥモローランド」を含む(だがキーワードには「ローランド」を部分的にも含まない)記事が出てくる,「PER」で引いて本文に「Super Charger」を含む(だがキーワードには含まない)記事が出てくる,の類。基本的にはかなり平凡な部分一致検索。その上で,不適切なヒットを抑制する仕組みも入っているのかもしれないが,逆にそれが不適切な取りこぼしも生んでいる気配がある。

続「ワードロボ」 取りこぼし Edit

取りこぼしの典型は,ある記事のキーワードを引いたらヒット0になった,という挙動である。本来なら少なくとも自分自身は出てこなければならない。もしその記事が「朝刊・夕刊」とウェブ版(電子版)の両方に掲載されているのならば少なくとも2本は出てこなければならない*11。ヒット0ならおかしいと気づくが,そうでなければ取りこぼしに気づくのは困難だ。さらに言えば,偶々データベースの更新が遅れただけのこともあるのかもしれないが,それでは説明が難しい例もあった。「盆栽」というキーワードがある記事に付いていたので引いたら0になったことがある。翌日もそうだった。ところが,翌々日になると,自分自身2本(紙面とウェブ版)の他に多数の過去記事が出てきた。偶々データベースの更新が遅れただけなら,直近の記事が出てこないだけのはずである。また,0になるときでも,複数付いているどのキーワードでも0になるわけではないようだ。0にならないキーワードには自分も出てくる。これはデータベースの更新遅れ説に不利である。また,0になるキーワードを記事検索で引いたところ,元記事は出てきた(サンプルが少ないので,おそらく常に出てくるのか,出てこないこともしばしばあるのか,等までは不明。)。

「ワードボロ」補足 Edit

その他,小さいことを列挙する。

ワードロボまわりはネタが尽きない。

キーワードによるアラート Edit

「自動記事収集」という機能があり,登録したキーワードが新着記事(紙面やウェブ版)にあるとメール通知が来る。ただ,ウェブ版独自コンテンツは検索対象となるものとならないものがある。「マネー」のカテゴリーに属しているものは対象外のようだ。(マネー下の記事は,記事の「保存」ボタンがないなど,他の電子版コンテンツと扱いが違う。)「ヘルプ」には特に注記がない。検索漏れがあることに要留意。

「自動記事収集」は5件まで,は少なすぎる。後述する「保存」機能が弱いので,それを補う手段が欲しいのだ。例えば,連載記事の第1回を読んで気に入ったので,忘れずに第2回以降も読みたいと思った場合,どういうアラート手段を使えるだろうか。現状では「保存」で我慢するしかない。メール通知機能のある「自動収集」で代用したい気持ちも強いが,こちらは5件までと制約が大きく多用できない。

検索漏れ Edit

記事検索について述べる。記事を,それが発表されたときに漏れなく目にする,というのはありえないし,電子メディアの時代に馬鹿げている。検索がまともに機能することが極めて重要になる。しかし,現状,全文検索しか当てにならないし(キーワードの実態について,前述ワードロボ参照),その全文検索すら検索漏れがある。通常,全文検索は全部出てきてしまうから困る代物なのだが,日経電子版では全部出てこないから困る。以下,述べる。

図表の中のテキストを検索できない Edit

「2010年活躍した弁護士ランキング」(2010/12/24付日本経済新聞 朝刊)に名前が載れば検索できるだろうか。意外にもできない。名前は表に一覧されているが,表の中のテキストは記事検索の対象になっていない。例えば久保利英明氏(6位)や葉玉匡美氏(7位)は検索上は選外である。記事本文に名が出た少数の人を除き,紙面のランキング上位1桁に名前が出ていても検索できない。(本文に全員の名前を出すなら,表は要らないし,それではきわめて読みにくい記事になる。)検索されなければ存在しない,はネットの負の側面だが,それが日経にもある。「ボスの名前が出ていない」は早合点かもしれない。

まとめれば,紙面では表の中だろうが,本文であろうが,文章は文章であるが,記事検索では図表の中か本文かで扱いが異なる。ただ,この問題は日経電子版ではなく日経テレコンの問題だろう。

図表は「朝刊・夕刊」では基本的に画像で表示されるが,前述の通り,ウェブ版に同じ記事が掲載された場合は,図表がHTMLのテーブルで組まれていることがしばしばある。しかし,たとえウェブ版でHTMLのテーブルで組まれていても,次のいずれにおいても記事検索の対象となっていないようだ。(1)「朝刊・夕刊」のコンテンツがWeb刊等に表示されている場合*12,(2)「朝刊・夕刊」と同一記事だが本籍はウェブ版である場合(属性表記が「電子版」になっている場合が典型),(3)そもそも電子版独自コンテンツ。内部のデータベース上の属性で「表」になっていれば,画面上に最終的に画像として表示されていようがテキストとして表示されていようが記事検索の対象とならないようである。

ハイフン Edit

全角ハイフンを含む語を記事検索で引いても,意図した結果を得られないことがある。技術的なことなので結論だけ言うと,全角ハイフン(ダッシュを含む)の混乱を記事検索プログラムは考慮していない(2010年12月1日時点)。プログラムは汗をかかず,人間が汗をかく仕組みなっている。しかし,プログラムは人間の代わりに汗をかく仕組みではないか。とりわけ日経電子版のような,文字コードの専門家でない,広く職業人*14が使うシステムの場合は。……それにもかかわらず現状は,全角ハイフンを含む検索語を的確に引けるかは利用者のリテラシーに委ねられている。

検索語とヒット数Unicode名称簡単に言ってどういう文字か(どういう意味か)
GFAJ–10Funds–i0全角U+2013EN DASHenダッシュ
GFAJ—10Funds—i0全角U+2014EM DASHemダッシュ。全角ダッシュ
GFAJ―14Funds―i2全角U+2015HORIZONTAL BAR欧文で会話文の「」に相当する使い方をされる。Quotation dash。和文でも2本つなげて似た用法をする(下記参照)。日経もその用法で使う。しかしいずれにせよハイフンの意味ではない。
GFAJ-11Funds-i0全角U+FF0DFULLWIDTH HYPHEN-MINUSハイフン,マイナス。どちらの意味でもよい(そういう文字)。
GFAJ-11Funds-i0半角U+002DHYPHEN-MINUS上記と全く同じ(その半角)。
GFAJ‐10Funds‐i0全角U+2010HYPHENハイフン。「ハイフン(四分)」(JIS X 0213:2004の日本語通用名称)。
GFAJ−11Funds−i0全角U+2212MINUS SIGNマイナス

なお,日本語や英語の常識として,ハイフンとダッシュは意味が違う。過去にはコンピューターの使える資源が非常に乏しかったこともあり,代用され一緒くたにされることもあったが,いまは違う。我々はもう貧乏ではない。

過去の経緯は兎も角,今日ではハイフンを全角で書くときはU+FF0Dで書く(そう変換される)のが普通だろう。しかし,それで検索すると,上記のように利用者の意図した結果にはならない。日経電子版では全角ハイフンにU+2015 (HORIZONTAL BAR) が使われている。このずれをプログラムが吸収するのは非常に簡単(極めて簡単)なのだから,システムを修正すべきだ。どちらが正しいのかの議論は,職業人には必要ないし,ましてやコンピューターに合わせる必要などさらさらない。

stop words Edit

夕刊に「ところ変われば・・・」という連載がある。本にもなっている人気連載である(Amazon.co.jp: ところ変われば : 日本経済新聞社)。朝日の「特派員メモ」をもっと長くしたものに相当する。連載名は以前は「ところ変われば」,2010年3月15日から「・・・」付きに変わった。ただ,エディターは「・・・」と書いていることもあれば「…」のこともあり,馴染んでいないようだ。(なお,ブラウザー上で点の高さ位置が中央に見えるか下部かは,フォントのデザインの違いであり,字の違いではない。)この半年で

回数
ところ変われば・・・19
ところ変われば…3

という揺れがあり,直近を見てもまだ固まっていない。「ところ変われば」で検索すればこの両方が出てくる。ところが,「…」付きで検索すると0になる(2010/12/27 PM 4:38時点)。「…」はstop wordsのようだ。ただ,stop wordsという概念を知っている利用者がどれほどの割合いるのだろうか。実際,直近(2010年12月27日)の「ところ変われば・・・」には「ところ変われば…」というキーワードが付いていたので,ワードロボではヒット0になった。社内的にも知られていないようだ。

実数検索数
ところ変われば・・・1919
ところ変われば…30

キーワードによる記事検索 Edit

各記事にはキーワードが付いており(ワードロボで使われる「関連キーワード」がそれである。),記事検索では,キーワードのみを検索範囲として検索することができる。しかし,これに多くを期待できないことは前記ワードロボの項を参照。

その他いまいちな点 Edit

Evernoteでクリップすると背景で本文が読めない Edit

2011年 4月24日頃からか,背景の色(背景画像)で本文が読めなくなることがある(Chorome用extention使用。他は不明。)。以前から(と言っても2月頃からだったか),背景に余計な画像が入り込むことがあったが,それがさらに酷くなり,かなり広い範囲で本文が読めない状態になる。Everenote側の改良を待つしかないのだろう。当座の対処としては,クリップ前にjavascriptでページの背景を消す手がある。(2011年 4月24日記載)

「保存」 Edit

記事を「保存」しておくことができる。電子メディアでは定番の機能だが,まだまだ工夫の余地はある。例えば,連載記事の1回目を読者が保存したなら,明日の2回目を読み忘れないようにとの意図で保存したのかもしれない。つまり,保存記事を軸にした新着記事アラートもあるとよい。単なる簡易な切り抜きと位置づけるのは勿体ない。単なる定番機能の位置づけに留めなければ,用途は広がる。

なぜ直接,日経に言わないの? Edit

ここに書いた不満をなぜ直接日経に言わないのだろうか?

要望・質問を送りにくいからである。日経新聞電子版のカスタマーサポート(「問い合わせ」)は,フォームの入力項目が多すぎる。一つのフォームであらゆる内容を受け付けようという「汎アメリカン主義」の設計方針からそうなったのだと想像できるが,読者としては面倒でしょうがない。読者(消費者)目線欠如の最たるものだ。顧客志向ではなく,技術者志向(あるいは顧客サポートの手間を,顧客の負担で減らす志向)でインターフェースが作られている。わざわざ要望を出すユーザーをもっと大事にすべきだ。スーパーに,買物が少ない人向けの特設特急レジがあることがあるが,そういうのが欲しい。(2010年11月 7日)

個々の顛末 Edit

「FireFox 3.6で「朝刊・夕刊」を見ると画面レイアウトの一部がおかしい」と先日カスタマーサポートに連絡した際は,「サポートする利用環境」が書かれたページのURLを書いて,そこをご覧下さい,という非常に簡潔至極な返事が返ってきただけだった(2010年10月 7日付け)。そのページを見ると,FFは3.5までしかサポートしないようだ(2010年11月 7日時点でもそうなっている。)。しかしFFの製造元が3.5はobsoleteであり,3.6に移行しろと宣言して久しい。(2010年8月でサポート終了というのが当初の発表だった。現在,暫定的に延長されているが。)それでも日経は,3.6を使っている人の言い分は一切聞きません,式の対応をする。

その他 Edit

「2010/○/○付」 Edit

記事の日付が「2010/11/19付」あるいは「2010/11/16付 日本経済新聞 夕刊」等,「付」があれば,出所は(ウェブ版ではなく)紙面である。(つまり「朝刊・夕刊」と同じコンテンツである。)他方,「付」がなく,時刻まで記述されていれば出所はウェブ版である。これが基本パターンのようだ(補足あり)。

さて,「付」が付いている記事,即ち,本籍が「朝刊・夕刊」のコンテンツは「朝刊・夕刊」の領域の外でも普通に目にする。「朝刊・夕刊」の領域は有料契約者限定だが,そうではないWeb刊等を普通に見ていても「朝刊・夕刊」のコンテンツをしばしば目にするのである。前述の通り,電子版には2種のメディア(「朝刊・夕刊」とそれ以外)があるが,表示される場所は重なっているのだ。「朝刊・夕刊」とウェブ版の垣根,即ち電子版内の垣根はかなり低い。

この垣根の低さは,コンテンツの表現を柔軟にする上でも役に立っている。例えば,総論+2つの各論,のような構成の記事(特集記事に多い。例えば,二人のインタビューからなる記事。)は,「朝刊・夕刊」ではバラバラの記事に分割する方針のようだ(いわば分割主義。データベースの厳格性が背景にあると思われる。)。分割されているので,「次の記事へ」や関連記事のリンクで読み進める必要がある。読む上でもクリップする上でも不便。だが,その記事が「朝刊・夕刊」の外に出てくると,1枚の記事にまとめられる(こともある)。紙面をウェブに再現するのが狙いの「朝刊・夕刊」より,紙面の利便性(一覧性)に近くなるのは皮肉だ。このように「朝刊・夕刊」は表示形式に硬直性がある。

変則ギャラリー Edit

ところで,日付の書式は上記パターンに当てはまらない(矛盾する)こともある。例えば,ある記事の「関連記事」の一覧に次のような項目があった(一部引用)。

  1. 日経電子版「6カ国協議再開で韓国、哨戒艦事件謝罪は条件とせず 」 (2010/11/9 1:17)
  2. 日経朝刊6面「北朝鮮首相が訪中、農業施設や企業を視察」 (2010/11/3付)
  3. 日経夕刊2面「中国軍幹部と金総書記会談 地域安定へ友好確認」 (2010/10/26 10:29)

1番目は「電子版」と名乗り,日付が時刻まで載っている。互いに整合している。2番目も同様に名乗りと日付の表記が整合している。しかし,3番目は整合していない。記事を開くと「付」はない(もし時刻「10:29」に「付」が付いたら破格に思える。)。上記例は同一の記事に付いたものである。幾つかの記事を見渡したところこのような幾つかのパターンを集めることができた,ではない。一つの記事に複数のパターンが混在していた。

右クリック禁止 Edit

登場当初,右クリック禁止という時代遅れの仕組みが内外から揶揄されたが,有料会員になると右クリックの制限はない(全てのページで制約は存在しない。)。

事例のメモ Edit

2つのメディア,2人のエディター Edit

編集の自由度 Edit

3人のエディター? Edit

「朝刊・夕刊」には載るが,検索できない記事 Edit

記事を「保存」して,後刻,本文を見ようとすると,本文を表示できないコンテンツがある。版権絡みだと思われる。例えば,ウィリアム・J・ペリー氏の「私の履歴書」がそういう扱い。「朝刊・夕刊」では読むことができる。しかし,当日の「履歴書」を保存し,その場で開いても,本文を表示できない。表示されるのは見出しまで。さらに,「朝刊・夕刊」上では本文の下に「バックナンバー」が一覧されているのだが,そこを開いても同じように本文だけ読めない。前日の「バックナンバー」でも同様(ただし,「朝刊・夕刊」の日付を切り替えればその範囲では過去記事を読むことができる。)。

電子メディアには収録しない。記事検索の対象にすらならない。例外は「朝刊・夕刊」のみ。という契約カテゴリーがあるのだろう。(連載小説のように,「朝刊・夕刊」にすら載らないコンテンツもある。)ただ,こういう扱いの記事は多くはない。外部執筆者の内,作家では多いのかもしれないが,外部執筆者コンテンツの代表である「経済教室」は特にこういう限定はないようだ。経済教室のコンテンツは,時に,無料会員も読める場所にも掲載される。個別契約とエディター次第だろうが。

紙面と「朝刊・夕刊」の文章が違うこともある Edit

「日経実力病院調査」(2010/12/16夕刊)には「実力病院のより詳細なデータを電子版『ライフ』で掲載します。」という一文がある(紙面)。「続きはウェブで」の類である。面白いことに,「朝刊・夕刊」では「電子版」が取られて単に「……データを『ライフ』で」になっていた。現在地が電子版だから重複になると考えたのだろう。細かいが律儀だ。(最初は「日経ライフ」という雑誌があるのかと思ったが。)「朝刊・夕刊」のエディターが個別に削っているのだろうか。しかし,電子版「朝刊・夕刊」から電子版「ライフ」へのリンクにはなっていなかった。紙から離れられない「朝刊・夕刊」。

その他 Edit

このページのPDF Edit

このページをタイムスタンプ付きPDFにしたものを掲示しておきます。その時点でのこのページの内容を,電子的に証明する仕組みです。ウェブページのコンテンツが他人に剽窃された際,どこにオリジナルが存在したか裁判で証明する上で決定的かつ明快な証拠となります。

関連情報 Edit


*1 逆に,紙面に限定して検索,等はできないので,同じ記事が2つずつ出てきてイライラする。
*2 応答速度はネット経路でも大きく変わるし,意外とブラウザーの差が大きい。
*3 なお,内部留保の金利(資本コスト)の方が借入金のそれより高い。コーポレートファイナンスの基礎である。
*4 クッキーではないようだ。
*5 ご免なさい。当ページのURLも不気味に長いです。冒頭記載の短縮URL・直通URLをお使い下さい。
*6 実際はアルファベットの検索漏れも無視できない水準だと思う。Googleのtweet検索(「アップデート」)で少し実験してみれば分かる。
*7 see NET/www
*8 「しかも」と書きたいのをぼかした。本当は,二重に馬鹿ということである。
*9 エディターの頭の中にあるそれ
*10 シンポジウム「デジタル時代の文字・活字文化」2010/12/27付日本経済新聞 朝刊
*11 偶々文章のずれを突いた稀少な場合を除き。
*12 実際はこの場合は画像のままか表が削除される。
*13 そもそも「日本経済新聞朝刊連動」という呼称は他人行儀である。
*14 学生のような暇人ではない
*15 少なくとも私がこれまで作ってきたソフトはそうなっている。

添付ファイル: file20101227-101055_over.6pb.info.pdf 455件 [詳細] file20101211-052153_over.6pb.info.pdf 432件 [詳細] file20101128-113242_over.6pb.info.pdf 631件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2011-06-26 (日) 11:41:16