Table of Contents

このページは日本経済新聞電子版(nikkei.com)を取り上げている。 http://over.6pb.info/nikkei-wiki でこのページに直接アクセスできる(直通)。初出:2010/11/07頃。2011年に入ってからは部分的にしか更新していないので内容は古くなっている。文中,各社の商標はそれぞれ各社に属する。

電子版に一番期待することは? Edit

Q:電子版に一番期待することは?

A:紙面をスクラップする代わりになること。人類は長年,新聞を保存するため紙を切り抜いてきた。技術の進歩の恩恵を受けたい。端的にはEvernoteに保存したい。

よい点 Edit

コピペ自由 Edit

コピペに(技術的)制約が加えられていない(つまりコピー&ペースト自由)。本文をごく普通のテキストとして取り出せるし,記事中の写真・図版も同様。有料,無料会員問わず。(なお,コピペが技術的に自由だとしても法的に自由かは別問題。)このためEvernoteにも何の不都合なく取り込める(どのページでも取り込める。「朝刊・夕刊」を含め。)。

Evernote余話 Edit

日経の記事をEvernoteに取り込むにあたっては,AutoPagerizeがブラウザーに入っていると便利。日経に限らないが,一つの記事を複数のページに分割しているサイトは多い(それが主流だろう。)。単に閲覧するだけでもページめくりは面倒だが,Evernoteに取り込む際はさらに面倒になる。AutoPagerizeはページを自動的に連結して一つのページとして表示してくれる。詳細はAutoPagerizeを。

  • 2010年12月 3日に公開されたGoogle Chromeブラウザー8でクリップすると,レイアウトが若干崩れるようだ。
  • Evernoteにも現状不満はある。だが不満は人によって違う。全ユーザーの満足を図るとつまらない製品になってしまうので,ユーザーの不満を部分的に解決できる仕組み(プラグイン)があるとよい。詳細はNET/Evernoteを。
  • Chromeブラウザーを使っていると,Googleの検索とEvernoteの検索が連携するので便利。Googleの浸透度が増していく。

朝日新聞は身勝手 Edit

「朝日新聞デジタル」(朝日新聞電子版)が始まった。初日に早速契約したが,不満もある。2011年 5月20日

  • 「朝刊」の記事のタイムスタンプが「2011年5月20日02時33分」式なので,電子版独自記事なのか,紙面と同じ内容なのか,後日,見ても分からない。(なお,Evernoteに保存するのは当然。)日経と違い,紙面の再現というアプローチは採らない方針なのだろうが,そうであれば,タイムスタンプの保証を確実に行う必要がある。
    • これと背後でつながっているのだと思うが,「夕刊」がない。
  • 関連記事へのリンクが非常に貧弱。ハイパーリンクを,しかもコンピューター支援で自動生成するという電子メディアの特性を生かし切れていない。
  • 記事を別窓や別タブに開いて見ることが出来ない。意図的に「禁止」しているのだと思われる。余計なお世話だ。ある見出し面(ページA)を見て,この記事(B)とこの記事(C)を読みたい,まずBを見るが,Cを見忘れないよう,Aの画面を残しておきたい,あるいは,まずBとCを別の別のタブに開いておき,順に読みたい,と思うことはよくある。それができない。
  • Q:1000円も払う価値があるのか?
  • A:明らかにあります。切り抜きをしなくて済む。自分の人件費を考えれば明白です。(僕の感覚では,月1回でも紙を切り抜きすれば,つまり,その代わりになれば,元は取れる。)その上,デジタルなので検索等も出来ます。

以下は「朝日新聞デジタル」が始まる前の記述。当面,残しておく。

朝日新聞の記事をEvernoteに保存するのは非常に難しい。

まずasahi.comは対象として不適格。紙面の一部しか載らないので,欲しい記事が載っていないことの方が多い。載っていても,かなり省略されているので肝心の部分が欠けていることが多い。別のメディアである。

次に,「アサヒ・コム パーフェクト Fullコース」という一見,日経電子版と似た利用形態があるが,根本的問題がある。これは契約上,コンテンツの私的コピー(著作権法30条)すら許さないようである。(ちなみに,大学内では「朝日新聞 聞蔵IIビジュアル」というもっと便利なものが使えるが,法的制約は変わらない。)さらに,「アサヒ・コム パーフェクト Fullコース」は日経電子版の「朝刊・夕刊」の内,朝刊しかない。そもそも,「アサヒ・コム パーフェクト」は記事検索のサービスであり,新聞をウェブで見ることを狙いとしたものではない。

朝日は記事を新聞社の私物と考えているように思える。この20年で世の中は随分進歩した。過去数百年,人類は,紙を切り抜かないと新聞を保存することはできなかったが,技術の進歩によりEvernoteが登場した。しかし,朝日新聞の消費者は技術の進歩の恩恵を享受できない。技術が進歩するとむしろ不便になる,という「駄目な日本」の好例である。

自律的に朝日新聞その他が変わることを期待してもしょうがないから,朝日新聞その他に,変わるインセンティブを与えることが必要だ。さて,具体策は?

対等な2つのメディア Edit

  • 前提整理。日経では同一の記事が,1.紙面,2.(電子版の)「朝刊・夕刊」,3.(電子版の)「Web刊」等,の3つのメディアで掲載されることがある。1=2(ほぼ)は言うまでもない。2と3の区別がまず第1のポイント。次に,「電子版」という名称は,(a)「朝刊・夕刊」を含む,2と3の総称として使われることもあれば,(b)「朝刊・夕刊」以外の総称(3のみ)として使われることもある。これでは混乱するので,以下ではウェブのコンテンツの内,「朝刊・夕刊」以外を一括して「ウェブ版」と呼ぶ(3に相当)。
    123
    紙面「朝刊・夕刊」Web刊,等
    a電子版
    b朝刊,夕刊?電子版
    当ページ紙面「朝刊・夕刊」ウェブ版
  • 2と3の文章が同じでも,2のコンテンツなのか,3のコンテンツなのか,明確な区別がある。Web刊を見ていて,記事の日付に「付」の文字が入っていれば2,入っておらず,日付に時刻まで記載されていれば3である。(これが基本パターン。例外もある。後述。)2と3を区別する必要が生じるのは,2のコンテンツは「朝刊・夕刊」(ここは有料会員しか見ることができない)の領域のみならず,Web刊等の領域(ここはゲストも見ることができる)にも表示されるためである。

さて,紙面とウェブ版の両方に掲載されている記事は,どちらも同一内容が原則のようだ。日経の明確な方針は分からないが,例えば朝日新聞ではウェブに載る記事は紙面の同じ記事の短縮であることが多く,逆に紙面より長いことは(「続きはウェブで」の類を除き)私が気がついた範囲では存在しない。言うなれば,朝日は紙面中心である。建前としては,紙面とウェブでそれぞれエディターが違うから,元の記事は同じでも,どういう文章にするかはエディター次第ということなのだろう。(識者コメント(社会面の記事でよく見かけるあれ)が朝日のウェブに基本的に載らないのも,著作権上の理由からであり,省略ではないのかもしれない。)しかし,常に短くなるのは不思議である。エディター云々は建前であり,基本方針は紙面の短縮が(無料の)ウェブ版という方針ではないか,そう推知させる挙動になっている。これに対し,日経電子版では特に主従の関係はないようだ。むしろ,紙面(東京最終版)にない記述がウェブ版に加わっていることもよく見かける(内容の実質的追加のみならず,分かりやすくする語句を補うこともよく見られる。)。まさにエディター次第を推知させる挙動である。

  • てにをはの「が」と「は」が1箇所だけ入れ替わっていることもあった。「地域別では米国・欧州での設備投資額当初計画を下回ったが、東南アジアは7.0%、中国は3.9%上回った。」(2010年11月28日朝刊。ウェブ版では「は」。)別の例では,「原油価格は前年同期に比べて10%強上昇」(ウェブ版)→「原油価格は前年同期比で10%強上昇」(朝刊)。全文1035文字の記事でこの箇所だけ異なる。少しでも字数を少なくしようというより,日本語の感覚の違いだろう。
  • 本文が同じでも,見出しは差が出やすい。見出しが違うと記事の印象,もっと言えば,記事を読むか読まないかに如実な差が出る。面白い具体例を幾つか後述した。
  • 本文が同じでも,紙面にはない図表がウェブ版には加わっていることもある。例えば1面トップだと面積の制約が厳しい。でも図表を付けたい,ということはしばしばあるのだろう。電子メディアは面積の制約を受けない,の好例。しかし逆に,文章は全く同じで,紙面にある図表が(権利関係の制約もないようなのに)ウェブ版(コンテンツ3)では割愛されていることもある。これではウェブを客寄せとしか考えていない朝日新聞と同じである。この点は次に力説する。

では,ウェブに無料で載る記事が紙面の短縮である(朝日流)のはけしからん?私はそうは思わない。問題は,少なからぬ消費者が,新聞は無料でウェブで読める,ウェブに載っている記事は紙面に載っている記事と同じである,紙面に載っている記事の(全てではないにせよ)大半がウェブにも(無料で)載っている,と誤解していることだ。実際は両者の関係は個々の新聞社の方針でまちまちである。読者のこの誤解があるにもかかわらず新聞社は誤解を見て見ぬ振りして短縮記事を載せ続けており,このことが,新聞に購読料を払わない(払いたくない)人にますます払わない方向のインセンティブを与えている。情報格差,貧困化の一側面と言うべきだろう。彼らは自分で自分の首を絞めているのだ,と言うことは,国民経済の観点からは適切ではない。労働者の質を平均的に低める。また政治的にも危うい。たとえ日経や朝日がしばしば馬鹿げた(偏った)記事を書くとしても,新聞がない世の中になるよりは遙かにましである。自分にベストの新聞がないから既存の新聞は一切要らない,は幼児的である。我々は,ベターな新聞に対して適切なコストを払わなければならない。さもないと民主政を維持できない。日経はウェブ版を有料化した。只で見ることができる情報は,情報全体の一部である,という明確なメッセージを消費者に送っている。これは経営的には大きな賭だが,民主政という点では好ましい方向と私は考える(成功するかはいまだ流動的だし,他にもやり方があるだろう。)。

  • ウェブ版(コンテンツ3)と紙面(1,2)の内容が同じ,またはほぼ同じなのに,ウェブ版では図表が割愛されていることがしばしばある。これは非常に不適切だ。電子版の有料会員は「朝刊・夕刊」より先にWeb刊を目にすることが多いだろう。(随時更新されるのはWeb刊だから。)その後,Web刊で見たのと同じ(と思われる)記事を「朝刊・夕刊」で見かけたとしても,読み飛ばすだろう。図表の割愛は,電子版の有料会員に対して,図表は見なくてよい,図表は見るに値しない,と言ってるのと同じである。なるほどWeb刊に図表を出すと,無料会員の目にも触れるので,制限したいのかもしれない。だがそのとばっちりを,日経電子版を支えている有料会員が負担するのは極めて不合理である。
    なお,図表とはグラフだけではない。「日本企業のイスラム圏市場開拓の動き」という題で各社の動きを一覧にしたものなど,本文にそのまま書くと箇条書きになってしまうのでそれを避けて一覧にしたものもある。その場合,記事に出てくる社名の内,幾つかは図表の中にしか出てこない。図表は本文のおまけではない。ところが,図表の中に書かれたテキスト(「朝刊・夕刊」では画像になっている)は記事検索では検索できないようだ。これは小さからぬ問題なので後述する。
  • 日経電子版(ウェブ版)では記事が更新された場合,「2010/11/25 12:17 (2010/11/25 13:29更新)」式の表示になることもある。しかし,この表示がないのに更新されていることもある。「最新の情報を反映させたので是非見てね」式のアピールをしたい場合は特に「更新」を付ける,という運用なのかもしれないが,なんとも恣意的だ。善解すれば,ウェブは速報性が特徴なので,どんどん内容を更新していき,最終的に紙面と同一の内容に行き着く,それが電子版の特質だ,という方針なのかもしれない。随時更新されるのは当然,という考えである。しかし,電子メディアとしてまだ揺籃期だからこれが許されるのだろう。新聞が政府等の圧力により記事の内容を修正することは昔からしばしば行われてきた。新聞は,記事のタイムスタンプとその時点での内容を保証する必要がある。恣意的な修正や撤回をしていない,という保証である。いまは1日2回固定される紙面という担保があるが,電子メディアとして将来的に独立するには,電子メディア自身でタイムスタンプを保証する必要がある。幸い,ウェブはテレビとは違い,更新履歴を保存するのが技術的にもコスト的にも容易だ。ウェブメディアの特質を活かすべき。
  • Evernoteを考えると,自分が保存した記事がその後,書き換わっていないか,すぐに判断できないのは不便だ。内容が古くなった記事をそれと知らずそのまま保存し,それを元に論文等を書くのは,彼の本意ではないだろう。現状では,「更新」表記の有無は当てにならず,本文をじっくり見比べるしかない。新聞読者の利便性(買い手の視点)を欠く。
  • 首都圏でプラネタリウム等が人気を集めているという記事は「2010/12/11 4:00 (2010/12/11 4:05更新)」だった。初出から5分後の「更新」。速報系の内容ではない。更新が付かない多くの記事と比べると,逆に恣意性が目立ってしまう。しかも,ワードロボには更新前の記事(「2010/12/11 4:00」)も掲載されており,それと内容を比べると全く同一だった。謎だ。紙面(同日朝刊)にも載ったが,やや多めの加除がある。

紙面とウェブの内容がまちまちになる,しかもほとんど同じで細部のみ違う「かもしれない」。――これは必ずしも欠点ではない。電子メディアが紙に制約されるのは不自然であり,まちまちを前提に我々はそれを使いこなしていくことになるだろう。面積の制約のある紙面に合わせて電子版の背丈が削られるのはおかしい。以下,そういう話になる。言い換えれば,2つのメディアが対等であることの利点は大きいので,欠点(内容が微妙にバラバラになる。ひいては,読者は「朝刊・夕刊」のみならず,Web刊の同じ記事もよく見ないと,しかも更新を随時確認しないと,記事の細部を取りこぼす。)は別の方策で補う,と考えることになる。記事同士のリンク(関連記事)などが使えるだろう。いま見ている記事や,過去に見た記事等から,各人に合ったお勧め記事を的確に提案する仕組みが鍵になる。ただし,お勧めがメールなどでばらばらと送られてくるより,何か記事を開くと,そこから芋づる式に読み進められるような仕掛けの方がスマートだろう。送られてくるお勧めの羅列を数時間おきに見させられると,とても疲れる。押しつけがましい。自らの関心に導かれるまま先に進んでいるような演出になっていると嬉しい。

  • 朝日新聞の社内ではasahi.comの記事は保存されているのだろうか?日経電子版(ウェブ版)の記事は単に社内的に保存されているのではなく,読者は記事検索で過去のものを読むこともできる*1。日経は紙面も電子版もどちらも公式な記事・コンテンツと位置づけていると思われる。さて,イエメン沖で日本企業のタンカー襲撃され,船員2名がけがをしたという記事が朝日新聞2010年12月15日の朝刊に載っている。いわゆるアフリカ東岸の海賊である。その記事は2010年12月14日20時14分にasahi.comに出ており,そこには,タンカーは中国海軍の護衛を受けて航行中だったと書かれている。だが紙面ではその記述はない(東京最終版)。新聞は時代を記録しているが,朝日新聞の公式な記録では,タンカーが中国海軍の護衛を受けて航行中だったという事実は消えてしまうのだろうか。新聞社が自分がどういう記事を世に問うたか証明できないとしたら,随分とお粗末だ。
  • 「朝刊・夕刊」とウェブ版の内容が違っても,アクセスランキングでは(そんなことはお構いなしに)「同じ記事」として集計されることがあるのかもしれない。その場合,「朝刊・夕刊」としてまとめられるようだ。ただし,アクセスランキングの挙動はまだ解明されていない(後述)。
  • 本文が全く同じインタビュー記事でも,紙面と電子版(ウェブ版)で使われているカットが違うこともある。例えば,丸紅の朝田社長のインタビュー記事は,紙面(2011/1/9朝刊「そこが知りたい」)では向かって左を見せているが,電子版(2011/1/8 21:56)では右を見せている。紙面のエディターは手の仕草に着目してカットを選んだのだと思われる。ただ,どちらもあまりよいカットではない。

記事がウェブで先に公表され,紙面があとになることはごく普通のようだ。速報系の内容なら当然であり,特筆するようなことではない。特集のような,速報系ではない内容の記事でも先に(つまり前日夜に)ウェブ版に出ることもある。

なお,電子版(「朝刊・夕刊」とウェブ版を含む広い意味)のコンテンツを見る場所は,「朝刊・夕刊」やWeb刊等だけではなく,例えば,「自動記事収集」,「おすすめ」,「保存」等にも広がっている。(「My日経」という名前が付いている。)色々なアクセス手段がある。しかし,このどこで見ても「同じ記事なら同じ」に見えるわけではない。例えば,「おすすめ」等では外信の写真は基本的に削除されるようだ。版権上の理由だと思われる。後述版権参照。

電子版にしかない記事を探そう Edit

紙面にはない,電子版(ウェブ版)独自の記事も少なくない。実際はかなり多い。電子版の購読料が高いか安いかは議論があるが,紙面に載っていないコンテンツも非常に多いことは一つ覚えて置いた方がよい。ただ,「独自」にも幾つか性格の違いがあり,日経の主要購読層(部課長クラス)にとって魅力的なものもあれば,そうでないものもある。いまは日経側でも方針の整理が付いていない段階のようだ。なにしろ,「これは独自コンテンツです」という印すら現状では特にない。

  • 「日経電子版、有料会員10万人突破」という記事(2010/12/11朝刊)は,「今後も独自記事を拡充していく」と言う。しかし,どれが独自コンテンツなのか,公式な印はない。紙の購読者にはないプレミアムなのだから,お得感を出す演出があってもよいのでは。

日経を読み慣れていれば,すぐ独自であることに気づくコンテンツも多いが,そうではなく,何日か(あるいは1週間ほど)経ってから「あれは独自コンテンツだったのかもしれない」と気づくものもある。さらには,日経本紙に載っても全くおかしくないのだが,結果的に「紙面には載らなかった」記事(いわばボツ記事)も少なくない。日経の主要購読層(部課長クラス)は,狭義の独自コンテンツよりも,「ボツ記事」に一番関心があるのではないか。例えば,紙面なら企業面に載るような個別企業についての少し長め(800字前後)の記事(ロイターと同類。日経QUICKニュースとも同類だが,それとは別記事。)で,「ボツ」になったものもかなり多そうである。そうした記事は,たまたまその日,Web刊で目にするのでなければ,後日,キーワード検索や「関連記事」(電子メディアならではの記事同士の連携。後述)で拾われるまで埋もれているのだろう。しかし,そうは言っても,ボツ記事(候補)も含めてくまなく電子版に目を通すのは非効率的というか,馬鹿げている。そこは電子メディアの特性を活かした工夫の余地がある。例えば,記事同士のリンク(関連記事)の工夫(前述後述。)。《昨日の独自コンテンツ一覧》(後述)も一案。日経電子版の営業部としては,埋もれている記事にスポットを当てる企画や仕掛けが必要になる。メディアの特性を活かして読者の負担を軽減すべきだ。

  • 負担が重いという概念は,大きな書類の山があり,その全てを本来は見なければならない,という条件があるために生じる。しかし,誘導のうまいcuratorsがいれば,本人は自ら見たいものだけを好きなだけ見ただけなのに丁度よい塩梅になる。勿論,curatorsの誤導もあるだろうが,それはまた次のステージの課題である。
  • 企業面に載るような例としては,「ローランド、米で電子ピアノ生産 普及価格帯3機種」(2010/12/4 5:51電子版)は紙面には載らなかった(この種の例を発見するのは中々難しい)。ごく普通の企業記事だが(727文字),内容は割と興味深いものだった。さて,「ウェブ版には載ったが紙面には載らなかった記事」の典型は「独自記事」というより「紙面ではボツになった記事」だろう。時間の関係でたいていは先にウェブに出るから,紙面のエディターから見ればボツ記事になる。しかし,ボツにも色々なレベルがある。
  • ローランドは欧米のプロには高い評価を得ているが,けいおん!で使われなかった。これは中国市場では今後かなりのダメージになるのでは?けいおん!を見た世代は,YAMAHAやKORGに強い憧れを抱くだろう。
  • 如何にも独自コンテンツ,の例としては「電子編集本部」の書いた記事がある。例えば,「ヤフー・グーグル提携 独禁当局、警戒緩めず」(2010/12/3 17:18電子版)や「ヤフー・グーグル提携『競争に反する』 前米FTC委員」(2010/12/12 11:09電子版)は来日した米国人へのインタビューを含む,如何にも張り切った内容だった。
  • 少し変わったものを紹介する。紙面の通常の部署が書いたと思われ,しかもその後,「日経電子版メールマガジン」の「今週の一押し」になったにもかかわらず,結局,紙面には載らなかったものもある。一押しは一つだけである。「『イトカワ』微粒子、公表の背中を押したNASA」という記事がそれ(2010/11/21 10:11電子版)。「科学技術部」の執筆。独自取材が入っていたようだが,たとえ1週間紙面に出るのが遅れても,鮮度が失われる内容でもなかった。朝日新聞なんて,ウェブに先に出して,数日後,紙面に出すことすらちょくちょくする。朝日の場合は,無料で広く見せたものを有料で紙面の読者に見せることになり,新聞購読者に失礼じゃないかと思うのだが……。
  • 後日振り返れば,これは独自コンテンツだったのかもしれない。でも,そんなそぶりはまるでなかった。いま,この部分を書いている最中に掲載された「あかつき失敗、宇宙開発後発組のジレンマ」(2010/12/12 9:38電子版。科学技術部 新井重徳)も,秘かに独自コンテンツなのかもしれない。日曜朝に,速報系の内容でもない科学技術部の記事,という全く同じパターン。それにしても,日経の宇宙ネタへの傾倒は意外なほどだ。
  • 紙面の地方面に載った記事は記事検索データベースには収録されていないようだ。(朝日新聞の記事データベースでは地方面の記事も網羅されている。)2010/12/31 8:11にウェブ版の「トップ > 地域ニュース > 中国 > 記事」に突如5本まとめて出てきた「瀬戸内造船サバイバル」という連載(全4回+インタビュー)は,内容の充実度からして元は紙面の地方面に載ったのではないか。形式上は連載なのに一どきに出てきたことからしてもなおさらその感がある。しかし,地方面は記事検索に載らないので,記事検索上はこの日の電子版が初出であること以上は分からない。
  • 「大阪・道修町 くすりの記憶」(2011/1/2 14:09)も元は大阪版ではないか。

逆に,紙面(と「朝刊・夕刊」)には載ったがウェブ版には載らなかった記事はどれくらいあるのだろうか(小説など「朝刊・夕刊」にも載らなかったものは除く。版権絡みでウェブ版には出てこない記事もあり(後述),それも除外してよいだろう。)。待て待て,ウェブ版に出なくても,基本的に全て「朝刊・夕刊」には出ているのだから,このような問いはそれほど意味はなさそうにも思える。しかし,そうとも言えない面もあるのだ。

まず,「朝刊・夕刊」には出ないウェブ版独自の記事も少なくないので「朝刊・夕刊」だけを見ていれば足りるわけではない。他方,「朝刊・夕刊」の記事の多くはウェブ版にも出てくるので,ウェブ版を随時見て,その上「朝刊・夕刊」も見ると実際にはかなりの部分は重複作業になる。こうした中,「朝刊・夕刊」にしか出ない記事がどれくらいの割合かという数字は,読者の行動に影響を与えるだろう。例えば,8割は出るのなら,「朝刊・夕刊」に目を通す優先度を下げるかもしない。これは各人の選択である。8割は出るのなら,逆に出なかった記事一覧,即ち《「朝刊・夕刊」には載ったがウェブ版には出なかった記事の一覧》が翌日「My日経」に出ると便利だろう。さらには,《紙面の記事がその後,電子版で補充されたもの》一覧,なども便利だろう。さらに言えば,《今日の「独自」コンテンツ一覧》ないし《昨日の「独自」コンテンツ一覧》も便利だ。ちなみに,日経電子版が始まる前の「日経ネット」の時代は,全記事の3割程度しかウェブに載せていなかったそうである(朝日新聞web2010年2月24日23時30分)。

その他よい点 Edit

  • 「朝刊・夕刊」では表がイメージ(画像ファイル)であるのに対し,同じ表がウェブ版ではHTMLのテーブルで組まれることがある。これは特に後日Everenoteなどで検索する際には非常に有益だ。朝日新聞のウェブはイメージを使っている(しかも原版を若干縮小しているようだ。)。但し,意外な落とし穴がある。この表の中のテキストは「記事検索」で検索できない(後述)。ワードロボ(後述)でも出てこないだろう。
  • Evernoteは日本語OCRを自動でかけてくれるが,微妙な誤認識は避けられない。
  • 但し,テキスト化を読者の利便性を増やす観点から意欲的に行っているかは疑問。例えば,土曜朝刊の「STOCK α」の表はHTMLになっていると便利だが,「STOCK α」自身が「朝刊・夕刊」にしか載らない(ウェブ版には基本的に出てこない。)。ブラウザーに表示されている情報を,手作業でエクセルに移していると原始人になった気分である。技術の進歩の恩恵を享受してコピペすることは,ここでは許されていない。ウェブ版は無料会員も読む余地があるからか。そうであるなら,無料会員は読めない記事としてウェブ版に出せばよい。なお,「STOCK α」に名が上がっても,本文に名が出ていない限り,記事検索では引けない(後述)。「ウチの社名は日経に出ていない」は早合点かもしれない。
  • ウェブの,HTMLで組まれた表をエクセルに取り込むにはtable2tsvが便利である。他社類似品とは性能が違う。
  • サーバーの応答速度が非常に速いのは満足。有料なのだから当然?契約者がそう言いたくなるのは分かるが,読売新聞オンラインも広告モデルにより実質有償で記事を提供している。しかし,読売新聞オンラインの応答速度は慢性的に遅い*2。広告モデルがはかばかしくないことは内外で指摘されるとおりである。しかし現時点では購読料モデル(広告も併用)の成功も約束されておらず,日経電子版も,現状では日々の購読料を担保に借金で設備投資している段階だろう(仮に会計的に内部留保だとしても単年度赤字が当面続くという意味*3。)。別の言い方をすれば,読売オンラインが真正の共有地の悲劇だとすれば,日経電子版も敷居が少し変わっただけで本質を変えることにはまだ成功していないと言えるだろう。契約していない「ゲストユーザー」や無料会員が圧倒的(?)多数であり,少数の契約者が提供した資源(キャッシュフロー)にフリーライドしている段階。有料購読者の比率が徐々に高まって,ある閾値を超えたときに初めて,共有地の悲劇から脱することができる。それまでは,サーバーの応答速度が速いのは蛸配当にすぎない。
  • 2010/7/8の日経記事によると,有料会員と無料会員の比率は1:5.3。「ゲスト」は含まれていない。
  • 2010年12月10日の発表によると,有料会員と無料会員の比率は1:5。「ゲスト」は含まれていない。有効桁数1桁。発表されるのはぼかした数字。
  • 2011年 4月26日の発表によると,有料会員と無料会員の比率は1:6.5。「ゲスト」は含まれていない。有効桁数2桁。無料会員の比率が高くなってきている。
  • 関連記事として,過去の記事を割と惜しげもなく出してくる(本来なら,過去記事は記事検索の商品であり,課金される。)。ただ,出てきたものが全てではないだろうし,重要な記事が抜けていることもあるだろう。記事検索とシームレスに連携するとより便利になる。(ワードロボが中途半端なのがイタイ。)無論,記事検索の領域に入れば課金されてもよい。

いまいちな点 Edit

一方通行 Edit

この記事は面白かったので,この種の記事を今後も掲載して欲しい,という意思を簡単に新聞社に伝える手段がない。後述するように,「問い合わせ」は非常に敷居が高いし,読者は暇じゃない。記事にボタンが付いていれば全てが解決する。なお,他の読者に伝えたいわけではない。新聞社や記者に伝えたいのである。

日付がない(朝刊・夕刊) Edit

「朝刊・夕刊」の個々の記事に日付がない。紙面の体裁を踏襲したのだろうが,Evernoteなどでクリップした際,いつの記事なのか後日分からなくなる。そもそもこれは紙面の時代からずっと,多くの人が悩んできたことのはずだ。新聞記事(紙の)を切り抜いた際,その日付・出典をどう書き添えるか(何新聞のどの面か。もしかしたら日経の北海道版かもしれないし,同じ東京版でも毎日,複数の版がある。)。切り抜きをしたことがある人なら必ず悩んだことがあるはずだ。紙版ではこれを新聞社側で改善するのはハードルがやや高いかもしれないが,電子版なら容易だ。それなのに新しいメディアの特性を活かしていない。と言うか,「朝刊・夕刊」以外には日付が入っているのだから後退している。読者目線に欠ける。

  • 裏技:関連キーワードからワードロボ経由で同じ記事を開けば,日付が入る。「2010/11/1付 日本経済新聞 朝刊」のような書式で。(ワードロボに一覧されている記事の内,日付に「付」が付いているものが「朝刊・夕刊」の記事である。例外もある。後述。)但し,万能ではない。開けない記事もあるし(バグや版権。後述。),「経済教室」のような大項目名が落ちてしまうこともある。後日,Evernoteで「経済教室」で検索しても見逃すことになる。これはイタイ。また,外信の写真は表示されないことも多い。ワードロボには色々制約がある。後述。
  • 偶に,キーワードがない,あるいはヒット件数が多すぎて,目的の記事が出てこない。その場合は,「自動収集記事」を便宜的に使う。適当な検索語を入れればよい。
  • 特に厄介なのは,「類似している記事(自動検索)」で過去記事を開いたとき。その記事にも日付がない。つまり,後日,Evernote上に日付のない記事があり,日付を推測しようにも,クリップした日を手がかりに日付を推測するのは間違いの元である。Evernote上の見た目では,その日の記事なのか,昔の記事なのか判別が付かない。
  • 「朝刊・夕刊」の各記事の上部に面名が入っているのはよい。Evernoteに保存した記事が1面に載ったものなのか企業面なのか,後日知りたいこともある。記事検索や「ワードロボ」等では面名は分からないので,縮刷版や図書館に頼るしかない。もっとも,ワードロボ等で見ると,面名は落ちてしまう。新聞社が自ら記事に付けた付加価値(記事の重要度の情報)を,自ら捨ててしまうのは勿体ない。

URLが一定しない Edit

同僚に「このページを見て」とメールにURLをコピペして教えても,相手はそのページを開けないことがある。相手も契約者であっても。……相手が開こうとすると,「ただいまの操作はお受けできませんでした。電子版トップから再度操作してください。」と拒否される。この通知は意味不明だが,種明かしすれば,URLがone-timeだったので開けなかったのだ(そういう場合にこの通知が出る)*4。各記事の下に出てくる関連記事や,関連キーワード(ワードロボ)を介して開いた記事がそうなる。(ならないこともある。条件不明。)他にもあるかもしれない。関連記事をたぐることは非常に多いだろうし,リンクは電子メディアの大きな特長である。そうして開いたページを同僚・知人に教えることができないのは,非常に不便である。

  • Evernoteでは,クリップしたノートから元記事を開こうにも開けない結果となる(常に開けないのではない。)。そんなことは滅多にしない?だが,ノートの記事が,クリップ後,更新されていないかを確かめることは実はありそうだ。前述の通り,電子版(ウェブ版)の記事は随時更新される。

これはワードロボ(や関連記事)という特別な仕組みを介したからそうなっただけ?極端な例?そうであるとよいのだが,日経電子版は,記事をURLで特定することにどこまで重きを置いているか甚だ疑問だ。例えば,新着記事は「トップ > 記事」というカテゴリーでWeb刊に出てくる。URLもこのカテゴリーを反映している。同じ記事を「経済」等のジャンル分けに入ってから開くと,「トップ > ニュース > 記事」になる。URLもこの階層を反映したものになる。どこから開いたかでURLが変わる。また,「トップ > 記事」の記事の下に付いている関連記事を開くと,記事のカテゴリーは「トップ > 記事 > 関連記事」に変わる。URLもこれを反映したものになる。如何にも仮のURL(カテゴリー)という匂いを漂わせている。また,新着記事は「トップ > 主要ニュース一覧 > 記事」というカテゴリーで出てくることもある。URLもこれを反映したものになる。その記事の下に付いている関連記事を開くと,記事のカテゴリーは「トップ > 主要ニュース一覧 > 関連記事」に変わる。その記事は,いまは「主要ニュース一覧」の関連記事から開いたが,もとは「トップ > 記事」にいたのだろう。その記事の本籍がどこかではなく,いまどのような経路で呼ばれたのかによって相対的にURLが決まるのである。

  • 「広がる『婚活疲れ』 合コン結果出ず鬱かも…」(2010/12/20 11:00電子版。同日夕刊)の本籍は「ライフトップ > 暮らしの知恵 > 充実生活 > 記事」のようだが,「ライフトップ > 親子 > 子どもニュース > 記事 > 関連記事」で表示されることもある。

URLが一時的・使い捨てなのは論外だとしても,日経電子版のURLはこのように浮動的である。否,一時的・使い捨てURLは,実は浮動的URLの素直な発展系であり,プログラム的には自然な延長とすら言いたくなる。どちらも,プログラムが(内部の法則で)記事を生成・表示できればよいという発想では同じであり,外部から記事がどう特定されるかは二の次である。日経のシステムは,記事を記事固有のURLで特定するという発想を欠いているのである。冒頭の例,「ワードロボの記事は,他人は開けない」は,特異ではない。記事をURLで特定することに冷淡という日経電子版の発想に沿っている。しかし,記事は固有のURLを持つべきである(OpenURL)。

  • 実際は同僚にURLをコピペして送ろうとしても躊躇するかもしれない。URLは不気味に長いことが多いからだ*5。意味不明の文字が連なっている。機械のことしか考えていない仕様だ。
  • 初出のURLとその後のURLが変わるものも少なくない。例えば,フィナンシャルタイムズの特約記事は初出は「トップ > 記事」だが,その後は「ビジネスリーダートップ > 海外メディア > Financial Times > 記事」になる。これはある意味では合理的だし,一つの記事が複数のカテゴリーを持つことも全然不合理ではない。だが,ここで後述することまで踏まえても最適かは争点になる。どこまで視野を広げるか次第。

記事のURLは,新聞社にとっては自社システムの延長であり,自社が自由にできるものと考えるだろう。しかし,その新聞がメディアとして社会の信頼を得れば得るほど,URLも公のものになっていく。一旦記事が発表されると,多くの人が長期にわたり,記事固有のURLで(記事固有のURLがあることを前提にそれで)その記事を引用・参照するようになる。ある人が「My日経 > ワードロボ > 記事」を見てその記事を友人に紹介した場合も,別のある人が「> ライフトップ > 暮らしの知恵 > 充実生活 > 記事」を見てその記事を友人に紹介した場合も,同一の記事なら同一のURLでないと,話が混乱する。ましてや,一時的・使い捨てのURLなどもってのほかである。同一の記事は固有・単一のURLを持つことが社会的に求められるようになる。日経電子版はURLの持つこの重みを未だ理解していない。それは日経電子版のメディアとしての地位が低いこと(期待されていない)の反映と見ることも可能である。電子版のシステムを外販する(それくらいの意欲は欲しい。)場合も不利だ。

なお,分類をしないコンテンツ管理が近年主流になりつつあり,日経電子版でURLが一定しないのもその反映と見る余地もある。しかし私は,分類を固定せよと言っているのでなく,URLを固定せよと言っている。但し,新聞が記事を1面に載せるか企業面に載せるかは,それ自体も大きな価値を持つ(価値を生む)。そこにはエディターの選択眼が反映している。それが新聞というメディアの特徴の一つだ。我々は単に断片的情報に金を払っているのではなく,エディターの選択眼にも金を払っている。電子化したらそれ(収入源の一つ)をばっさり捨ててしまうのは勿体ない。現状は,分類があるような,ないようなという中途半端な状態。URLが固定しないのも,背景には方針が定まっていないことがあると推測する。

  • 「町工場の技術、世界へ 『痛くない針』量産メド」が企業面ではなく朝刊1面(2010/12/30)に載ったのは,「町工場の技術、世界へ」というストーリーにエディターが惚れたからだろう。中国の台頭,デフレ,円高,就職難,悪い話ばかりである。読者も惚れるだろう。しかしフラットな電子版では「岡野工業の技術なしには作れない。」という記者の思いも埋もれがちだ。

被引用 Edit

URLが浮動的だと被引用(例えば,記事がどれほど引用・参照されたか)を辿るのが難しくなる。日経自身はサーバーのアクセスログを元に,分析業者に被引用数を推計させることができる。しかしその数字がどれほど実体に近いのかはなかなか難しい問題である。基本的に被引用数はかなりあやふやな推計に基づいている。そして,URLが浮動的であればあるほど数字の検証が困難になる。広告媒体として価値を高めるには数字の偏差を小さくしなければならない。しかも,被引用数なら推計で足りるが,内容を追うには推計ではすまない。内容を追うには浮動URLは非常に不利である。

  • 各種メディアにちょくちょく出る話に,Twitterをマーケティングに利用する,というものがある。だがこれには大きな問題がある。日本語の検索漏れは非常に大きい,という事実である*6。幸い,新聞記事のtweetについては,URLを検索キーにして検索精度を上げる余地がある。だが,URLが浮動的・一時的だとここにも落とし穴がある。

ある記事にコメントを付けてtweetする。同一記事に他人もコメントを付けてtweetしている。同一の記事をめぐり,他人のコメントを見るのは中々面白い。記事を書いた記者本人も気になるだろう。被引用の活用例。Topsyなどがその種のサービスを提供している(twitter.comにも具わっている*7。)。Topsyなどは「同じ記事」をURLをキーに集約している。URLが違えば別の記事になるので,コメントを共有するのが難しくなる。

日経電子版では,記事の表示されている場所(カテゴリ)は同じなのに,URLの途中が異なることもある。そういう場合も,Topsyなどからは別の記事とカウントされる。

  • 別の例と対比する。URLの末尾に?abcや#abcが付いているウェブページがよくある。その場合でも「同じ記事」ならそれらを取り除いた上でTopsyはカウントする能力がある。しかし,そのようにカウントされるのは米国のCNNなど主要サイトだけである。末尾に?abcや#abcが付いていていれば本来は別の記事であり,Topsyが個別に挙動を分析して例外処理をしている。yomiuri.co.jpは?を多用するが,Topsyは日本まで面倒見切れないので,全て別々の記事としてカウントされている。ましてやnikkei.comのように,?や#とは違う独自の内部ルールで生成されたURLは,途中が一文字で違えば単純に別の記事扱いである。自らTopsy八分になっている。

紙面は孤高にして連携は途上。 Edit

「詳細はウェブで」の類は世間並みによく利用されているが,それ以上の連携はまだ途上。「関連キーワード」(ワードロボ)で無理やりつないでいる段階。例えば,「宮内庁調査官が明かす『896の聖域』 天皇陵の真実」という記事が電子版(ウェブ版)に載っている(2010/11/27 4:00)。同日朝刊の「古代史解明の鍵 『陵墓公開を』強まる声」(2010/11/27朝刊)に連動したものだろう。しかし,「朝刊・夕刊」には,ウェブ版のこの記事へのリンクはない。勿体ない。

  • 紙面とウェブ版に同じ記事が載っていても,ウェブ版は補充的内容を含む場合もしばしばあることは前述した通りである。さらに,補充関係にとどまらず,紙面では内容が大幅に省略されていることもある。例えば,紙面では「短信」でも(その元記事に当たる)ウェブ版ではそうでないこともある。おそらく紙面の面積の都合だろう。困ったことに,現状,「朝刊・夕刊」には,より詳細な記事がウェブ版にあるという誘導やリンクが出ないので,「朝刊・夕刊」や紙面だけを見ていると,記事の細部を取りこぼす虞がかなり高い。細部の方がビジネスに役に立つことが多いのではないだろうか。やれやれ,一つの日経新聞なのに「朝刊・夕刊」,電子版の両方に毎日くまなく目を通すのは骨が折れる。2つのメディアがバラバラに動くのは読者を情報の洪水に放り出すものだ。幸い,電子メディアではリンクや関連記事,その他の手段で,2つのメディアを連携・融合させる(バラバラに動く利点を残しながら)ことができる。後述するが,電子メディアの特性を活かすことができる。
  • 例えば,「三越、高級バスツアー倍増」(2010/12/22付日本経済新聞 朝刊)はこう違う。下線部は紙面(「朝刊・夕刊」含む)にはない。電子版(ウェブ版)のみ。

    ……国内有名観光地の高級旅館やホテルに宿泊し、1泊2日の旅行代金は1人平均約15万円。景気低迷にもかかわらず、売上高は年率2けたで伸び、利益率も30%前後と高いという。利用客は三越の上得意が多いため、……

  • 前提整理。各記事には,「関連キーワード」(ワードロボ),関連記事一覧,「関連記事」という名の関連記事一覧,「類似している記事」という名の関連記事一覧,「この記事を読んだ人に人気の記事」,同じ紙面の記事など,非常に多くの他記事へのリンクがある。ただし,どの記事にもこれらの項目が付いているわけではない。どこまで付いているかは「場所」(メディアの種類)によって微妙に違うようだ。適切に使い分けている面もあるのだろうが,おそらく複数のシステムの寄せ集めのため微妙にずれがあるのだろう。主力メディアである「朝刊・夕刊」は連携が硬直的(後述)。

日曜朝刊に「日経新聞電子版 閲読ランキング」が載る。「朝刊・夕刊」上では電子版の各記事へのリンクになっていてよさそうなものだが,なってない。紙と変わらない。「朝刊・夕刊」の外にはリンクを貼らない方針?潔癖だ。(「朝刊・夕刊」の記事本文は,紙面の記事データベースの制約を強く受けるのだろう。紙面にないリンクを「朝刊・夕刊」に出現させるわけにはいかない,と。システム設計が硬直的ではないか。)しかも,この記事の関連記事欄にも各記事へのリンクはない。電子メディア同士なのに,どうあがいてもリンクをたどれない。なお,他の記事と同じく,「類似している記事(自動検索)」一覧はあるが,自動検索はランキング記事を的確に網羅するほど賢くないし,後述する大きな制約もあるので,この場面では全く役に立たない。

  • しかも,「日経新聞電子版 閲読ランキング」はウェブ版にも出てくるのだが(「ビジネスリーダートップ > コンフィデンシャル > 5分でわかる先週の動き > 記事」),そこでもハイパーリンクになっていない。リンクになっていたら5分では終わらない?
  • ウェブ版で読者コメントを募集するなど「連動企画」に関しては,「朝刊・夕刊」上にウェブ版(電子版)への特設リンクが貼られる。Web刊の「連載・コラム」へ移動する。
  • インタビューの「発言要旨」が紙面に載り,末尾に「詳報は電子版に」とあった。続きはウェブでの類である。「朝刊・夕刊」では「詳報は電子版に」の記述はなく,記事の下の「関連記事」に「メラメド氏のインタビュー詳細はこちら」が付いていた。ただ,そのリンクには行き先が電子版(Web刊)であることは示されていなかった(2010/12/21朝刊)。行き先は「トップ > インタビュー・会見 > 記事」だった。
  • 「詳細を○日付日経ヴェリタスに」と「朝刊・夕刊」に書いてあった。電子版にも,紙面とヴェリタスの中間の詳しい一覧が載っているのに,「朝刊・夕刊」にその言及はない。
  • 「文学周遊の写真がインターネットで購入できます。写真販売サイト『日経ストア』」はちゃんとリンクになっていた。

逆に,電子版から紙面(「朝刊・夕刊」)への連携も足りない。例えば,2010年11月16日朝刊経済2面の「今年度GDP実質2.3%増 NEEDS予測」という記事を見ると,紙面では表があるが,ウェブ版(2010/11/15 18:51電子版)ではない。ウェブ版は統計表の内容を本文の文章に取り込もうとしていた。しかし,表の内容のごく一部しか拾えていない。そもそも数字の表を文章にされても読者は困る。だから表がある。しかも,「詳細は『朝刊・夕刊』または紙面を」という誘導もなかった。ウェブ版の読者は,紙面にはきっと表があるはずと察しながら読む必要がありそうだ。

  • Web刊に少し珍しい形式の「記事」が載っていた(2011/1/2 AM 10:49確認)。記事の最後に,「『朝刊・夕刊』で詳しく」というリンクが付いている。「続きはウェブで」の類を電子版同士で行っていた。こんなことすら滅多に見かけない。内容は,元日1面トップ記事である元日特集から,冒頭2段落だけを取り出した文章で,最後に「朝刊・夕刊」の該当箇所に飛ぶリンクが付いていた(リンク名は上記)。つまり,紙面にはこんな記事が載っていますよ,是非見てください,という宣伝・誘導。ただ,そうは明示されていないので,「随分短い記事だな」で読み飛ばしてしまう人もいるかも。客を呼び込むにはあと一声足りない。新人営業のようだ。さて,この「記事」自体は記事の扱いではないようだ。記事ならあるはずの「保存」ボタンもないし,記事データベースにも収録されていない。元の文章の2段落目で尻切れになっているのだから当然か。肩書き日付は「2011/1/1付」だった。

さらに,「朝刊・夕刊」内の,一つの記事の中での連携も不十分である。紙面を読んでいると,欄外注記(「キーワード」という名前)が付いている記事がある。本文では,対応部分はゴシック体(紙面)になっており,鍵の印が付いている。キーワード欄を見よ,というわけである。ところが,「朝刊・夕刊」では単にボールドになっているだけで,リンクも何もない。紙面の体裁を知らないと,なんでボールドになっているのか分からないし,下に「キーワード」なるミニ解説が付いていることにも気づかないだろう。自分達の資源を生かし切れていない。

「類似している記事」 Edit

「類似している記事」という名の自動検索技術で関連記事へのリンクが(自動的に)一覧される。だが,「朝刊・夕刊」とウェブ版(Web刊等)とで挙動が異なる。「朝刊・夕刊」の「類似している記事(自動検索)」欄には「朝刊・夕刊」の記事しか出てこないようだ。他方,ウェブ版の同欄にはウェブ版と「朝刊・夕刊」の両方の記事が混在して一覧される。無論,後者のほうが優れている。現状,「類似している記事」の連携システムは一方通行のようだ。「朝刊・夕刊」から外へはリンクを貼らない方針?

さらに違いがある。ウェブ版では「類似している記事」には過去記事のみならず,未来方向の記事(いま見ている記事の後に出てきた記事)も出てくる。他方,「朝刊・夕刊」では過去方向のみのようだ。いわば,新聞発行時点で固定される。これはこれで一つの方針だが,勿体ない。とりわけ被引用(自分を引用した記事へのリンク。未来方向。)をたどれると事件のその後の展開を追いやすいので便利だし,この,被引用をたどるという行為は,紙メディアではできず,電子メディアならではの特技だ。それを捨てるのは勿体ない。引用と被引用の両方に移動できることが望ましい。そもそも,現状は,類似しているという自動検索により未来方向や過去方向に動けるだけであり,被引用や引用をたぐっているわけではない。

自動検索なので,漏れもある。連載の過去記事が一覧されているが,連番の一部が欠けているなど。例えば,2010年11月22日から社会面に「工場へ行こう」という短期連載が載っている。電子版(「朝刊・夕刊」)の第3回の記事からリンクをたどって第1回の記事に行くのは簡単だが(正にそのリンクがあるから。),第3回から第2回へは簡単ではない。「類似している記事(自動検索)」に第2回は出てこないのだ。

  • 「朝刊・夕刊」は「類似している記事(自動検索)」を3件に限っている。これは「どんぴしゃ」を少なくしている。自動検索が的確な記事を選び出す確率は高くないだろうから,3件は特落ちの危険が高すぎるように思う。
  • 「朝刊・夕刊」のコンテンツを「朝刊・夕刊」で開いた場合と,「朝刊・夕刊」の外で開いた場合との挙動の差も興味深い。例えば,「インドネシア国営銀、上海進出」という記事(2010年12月 6日朝刊)を「朝刊・夕刊」で開くと,「類似している記事(自動検索)」にはインドネシアの国営企業の記事が幾つか一覧される。他方,同じ記事を「自動記事収集」から開くと,「経済教室」の「インフラの海外展開」から2本が入った。この2本の記事には「インドネシア」も「国営」も出てこない。その限りでは誤検知である。しかし,見方を変えるとエディターの能力を補っている。後述するように,エディターは「経済教室」のコンテンツを十分活用しているとは言い難い。多少的外れかもしれないが,ロボット(自動検索)がそれを補っている。いずれにせよ,同じ自動検索でも,場所によって性格が異なるのは面白い。「朝刊・夕刊」は非常に保守的に設定されている。なお,「自動記事収集」で開いた場合,その下には「この記事を読んだ人に人気の記事」も一覧される。また,上記2本の「経済教室」の内,1本は当日記事だった。つまり過去記事ではない。

理想は芋づる (ワードロボ 他) Edit

紙面(「朝刊・夕刊」)とウェブ版との連携,に限定せず,電子版同士(特にウェブ版同士)の連携に話を広げる。

ウェブ版(電子版)と紙面には,どちらか一方にしか載っていない記事,両方に全く同一の文章が載っている記事,両方に載っているが細部が微妙に違う記事,しかもどこが違うかは,読んでみないと分からないし,読んだだけでは分からないことも多い,など多数の記事が溢れている。情報洪水である。しかし,これ自体は慶すべきことだというのは前述した通りである。幸い,関連記事などの仕掛けを用いて,我々は記事を読む負担を大幅に減らすことができる。ウェブというプラットフォームの恩恵である。ウェブの果実を受け取らない手はない。

  • 前述したことを繰り返せば,いま見ている記事や,過去に見た記事等から,各人に合ったお勧め記事を的確に提案する仕組みが鍵になる。ただし,お勧めがメールなどでばらばらと送られてくるより,何か記事を開くと,そこから芋づる式に読み進められるような仕掛けの方がスマートだろう。送られてくるお勧めの羅列を数時間おきに見ていると(見させられると),とても疲れる。押しつけがましい。自らの関心に導かれるまま先に進んでいるような演出になっていると嬉しい。

常識的には,全ての記事に目を通すのは不可能であるし,非常な苦痛だが,関連記事の作りがうまければ,読者の負担を大幅に減らすことができるし,耐えて全てを読む必要もなくなる。いま全てを読まなければ失う,という不安から人類は解放され,読みたいときが読み時になる。関連記事はそういう役割を担っている。さて,現時点で,日経電子版の各種の「関連記事」の仕掛けがその任に応えているかと言えば,残念ながら否である。おそらく,日経の側でも方針が見えていないのだろう。我々から提案していく必要がある。このページもそういう意図で作られている。

ところで,記事同士にリンクを貼るのに自動検索技術を使えば人件費を抑制できる。しかし,面白みがない。例えば,「新防衛大綱『動的防衛力』を提唱 中国に警戒感」(2010/12/5 22:10電子版)ならば,その先週に掲載された「やさしい経済学 多国間協調のゲーム理論」(岡田章・一橋大学教授執筆)へのリンクがあってもよいだろう。若い読者を紙面に誘う(ひいては購読者にする)には,地道に仕掛けを蒔き続けるしかない。リンクを貼ることは人を育てることでもある。また,エディターとロボットの違いを出せる場所でもある。例えば,「スターそろう『当たり年』なぜあるの?」(日経プラスワン2010年12月4日)の関連記事に経済教室の「空間経済学への招待」(佐藤泰裕・大阪大学准教授)を入れる遊びができるのは,ロボットではなくエディターだろう。

  • 関連記事を開くと,記事本文が「著作権等のため、本文は表示できません。」となることがある。(それはFinancial Timesの記事だった。公開期限の制約があるのだろう。)面白いのは,関連記事を一覧する際,どうやら中身を表示できるかよくは確かめていないらしい。関連記事,と一言で言っても,日経電子版にはいくつもの種類がある。自動化が高度に進んでいると思われる「類似している記事(自動検索)」(そういう名称が付いている),それより自動化されていないのかもの「関連記事」,特に名称なく関連記事が一覧される場合,などである。上記の例は,特に名称のない関連記事一覧だった。エディターが見出しだけしか見ずに一覧に加えたのか,それとも自動化されているのか,実情はよく分からないが,一つ言えることは,関連記事というアプローチを日経電子版はまだ十分に使いこなしていないということ。種類が複数あるのに,名称の違いが明確でない。
  • 「東芝が東南アジア専用液晶テレビ 停電でも2時間切れず」(2010/11/29 16:00電子版)と,「東芝、エジプトにテレビ工場新設 現地メーカーと合弁」(2010/11/29 10:43電子版)は,同じ日の記事でテーマが非常に近いが,互いに関連記事に出てこない(20:33現在)。(翌日,朝日朝刊では一つの記事になっており,扱いも大きめだった。)ちなみに,前者は「パワーテレビ」という商品名とのこと。経済の躍動感が伝わってくる。
  • 記事の本文中に過去記事へリンク(インライン)が存在することもあるが,ごく限られている。この面は完全に発展途上にある。

「ワードロボ」 Edit

  • 前提整理。記事には幾つかキーワードが付いている(「関連キーワード」)。「関連キーワード」を通じて関連記事を見ることができる。キーワードによるリンクであるから,記事から記事へと直接移動する「関連記事」類とは違い,「ワードロボ」という名の専用のシステムを経由する。
  • 「ワードロボ」で開いた記事からさらに「関連記事」のリンクをたどって次から次へと芋づる式に記事を移動していく,ことはできない。「ワードロボ」で開いた記事には関連記事が全く付いていないのである。これは意外と不便だし,前述の芋づるの理想にも反する。(なお,「ワードロボ」で開いた記事にも「関連キーワード」は付いているので,それを引いて再びワードロボに出ることはできる。しかし依然としてワードロボの中に閉じ込められている。)「ワードロボ」プログラムの独立性が強く,他のリンク生成プログラムが入り込めないのだと推測する。

ワードロボは,キーワードによって,その場で全文検索する仕掛けのようだ。最初はもっと賢いものかと思ったが……。各記事にはエディターによって事前にキーワードが付与されているが,そのキーワード同士の一致を見ているのではない。エディターは記事に付けるキーワードを決めているが,その先は全文検索プログラムに委ねられている,と思われる。そして*8,字句の一部分にマッチして,不適切な記事が一覧に出てくることもしばしばある。「ローランド」で引いて本文に「トゥモローランド」を含む(だがキーワードには「ローランド」を部分的にも含まない)記事が出てくる,「PER」で引いて本文に「Super Charger」を含む(だがキーワードには含まない)記事が出てくる,の類。基本的にはかなり平凡な部分一致検索。その上で,不適切なヒットを抑制する仕組みも入っているのかもしれないが,逆にそれが不適切な取りこぼしも生んでいる気配がある。

  • 記事検索と同じ制約を受ける。後述するように,図表(特に表)の中の文字は検索対象になっていない。「ウチの会社の名前は日経に出てない」は早合点のことが多い。
  • どういうキーワードを付けておけば,将来,その記事に対して読者を過不足なく誘導できるか(インバウンド),ではなく,その記事を見た人がどういう言葉で関連記事をたぐりたい(検索したい)と思うかを,エディターが察する(手助けする)仕組み(アウトバウンド)。実は,記事検索で検索範囲をキーワードに限定して検索することができる。(実際,額面通りに動いているようだ。本文の同じ記事でもキーワードに違いがあれば,検索の結果が的確に異なる。)おそらくキーワードはインバウンド用に付けているのだろう。それをワードロボ(アウトバウンド)に転用するのは悪いアイデアではない。問題はインバウンドまたはアウトバウンドに合った方針で安定してキーワードが付与されているかだ。なお,図表の中のテキストはそもそも全文検索でも引けない(前述)。検索して「ウチの社名は日経に出ていない」は早合点になる。
  • インバウンドのキーワードはどのようなものでなければならないか。例えば,「社長」というキーワードが付いている記事がしばしばある。全文検索で機械的に「社長」を引いた結果を,エディターが内容を踏まえ個別に付けた「社長」で絞り込む意味がある。エディターが事前審査してくれているのである。つまり,全文に「社長」を含む記事の内,特にキーワードに「社長」を付けるに相応しい記事,例えば社長の個性に着目した記事等にのみ,統一的・継続的・安定的に熟練のエディターが「社長」を付けているのでなければ,「社長」というキーワードを敢えて付ける意味はない。――若干話が抽象的だな。そこでまず固有名詞を例に考えてみる。
    前述の「ローランド」で考えると,「トゥモローランド」等から「ローランド」が確実に区別されていると言えるためには,単に「トゥモローランド」等に間違って「ローランド」が付与されていないだけでは足りず,正しい「ローランド」の全てに一つも漏れもなく「ローランド」が付与されている必要がある。漏れのおそれがあればあるほど,結局全文検索せざるを得ず,キーワード「ローランド」の意味がなくなるからである。これを全ての固有名詞に確実に行うのは気が遠くなる。しかし「社長」はさらに困難である。抽象語だから。正しい「社長」の全てに一つも漏れもなく「社長」を付与することは単に不可能である。ここではっきりしたことは,インバウンド型ではエディターに非常に高い能力が求められる(人件費がかかる)ということである。その裏返しだが,アウトバウンド用途で付けたキーワードをインバウンドに転用することはできない。性格が違うからである。この後,少し実例を挙げるが,現場は迷走しているようだ。
  • 直近1年で見ると,本文に「社長」を含む記事は24,116件,キーワードに「社長」を含む記事は3,783件。数的には16%に絞り込まれている。では質が伴っているか。
  • でもアウトバウンド型なら適当でよいわけではない。例えば,組み込みOSで高い世界シェアを持つ「T―カーネル」が8年ぶりに刷新されたという記事(2010年12月 8日朝刊)に付いているキーワードは「デジタル家電」だけだった(「朝刊・夕刊」)。ワードロボのキーワードは,この記事を見た人がどういう言葉で関連記事をたぐりたいと思うかを,エディターが察する(手助けする)ものである。この記事の「朝刊・夕刊」と電子版に付けられたキーワードを比べてみよう。
    「朝刊・夕刊」デジタル家電
    2010/12/7 22:43電子版坂村健、OS、デジタル家電、組み込みOS、エンジンフォーラム、搭載OS、ダウンロード、トロン、組み込み基本、フォーラム、自動車エンジン
    足りないのも,過剰なのも,エディターがワードロボの仕組み・特徴を適切に把握していないことを示唆する。この記事の「フォーラム」は固有名詞の一部であり,「○×フォーラムを開催した」のような文脈ではないので,この記事から一般名詞「フォーラム」をたぐって他の記事に行きたい人がいるとは思えないし(アウトバウンド),全文検索「フォーラム」から特に「フォーラム」で絞り込む対象(「フォーラム」一語が著名な固有名詞ならそういう場面が考えられる)でもない(インバウンド)。また,「エンジンフォーラム」は記事冒頭の自動車エンジンに引きずられたのだろう。T―エンジンフォーラムは固有名詞(会社名の類)であり,「エンジンフォーラム」では全く意味をなさない。知識が全然なくても文章を読めば十分分かる。「フォーラム」を一般名詞や著名な固有名詞と誤解する等のこれらの間違いは,文章から固有名詞を的確に抜き出す能力がエディターに欠けているためである。また,「組み込み基本」は分かち書きの時事用語辞書*9が「Google日本語入力」以下であることを示唆する。もっと言えば,T―カーネルという商品名が抜けているのはアウトバウンドとして失格だろう。たとえその語が紙面に出たのが8年ぶりであっても。そもそもエディターは各分野の専門家ではないから8年ぶりかどうか分からないのが普通だ。エディターの専門性は内容ではなく日本語処理である。もっと言えば,固有名詞の形態素解析である。商品名をずばり取出す能力はその最右翼だろう。日経新聞の記事の文章は日本語として質が高いので,そこから商品名を取り出す能力は,内容が専門外であっても,それほど高くなくてよいはず。……この記事の例から言えることは,インバウンドとしてはエディターの能力が不足しており(人事ミス),アウトバウンドとしても的を外している。方針が定まっていないのである。
  • 「日本経済新聞社とテレビ愛知は13日、日本経済新聞の名古屋印刷30周年を記念し、……」という記事(2010/12/13 21:26)に「名古屋印刷」というキーワードが付いていた。エディターは会社名と思ったのだろう。
  • 「優秀で信頼できる記者を育てるには時間もコストもかかる」と岡田直敏氏(日本経済新聞社常務取締役)は言う*10。だが,電子版の現状を見ると,今後顕在化していく問題はエディターの力量不足とのアンバランスではないか。
  • 安定してキーワードが付与されているかは怪しい。例えば,経済教室 やさしい経済学 金融契約の歴史に学ぶ(名古屋市立大学准教授 横山和輝)の実績は以下の通り。
    キーワード
    1横山和輝、金融システム
    2横山和輝、金融契約、やさしい経済学
    3横山和輝、明石茂生、服部恵、武士の家計簿、札差
    4横山和輝、金融契約、やさしい経済学
    5台湾銀行、田中義一、日銀、金融恐慌
    6日銀、金融契約、やさしい経済学
    7金融契約、やさしい経済学
    なお,横山先生のこの論考は非常に面白い。
  • 同じく,経済教室 やさしい経済学 空間経済学への招待(大阪大学准教授 佐藤泰裕)
    1佐藤泰裕、空間経済学、大阪大学、EU
    2佐藤泰裕、生産要素、空間経済学、貿易理論
    3佐藤泰裕、大阪大学、空間経済学
    4空間経済学、産業集積、アウトソーシング
    5佐藤泰裕、空間経済学、大阪大学、集積
    6なし
    7佐藤泰裕、OECD
    8佐藤泰裕、空間経済学、横山和輝、大阪大学
  • 同じく,経済教室 やさしい経済学 企業の生産性と国際化戦略(京都大学准教授 神事直人)
    1なし
    2神事直人、若杉隆平、京都大学
    3神事直人、ハーバード大学、京都大学、経済学
    4神事直人、メリッツモデル、輸出、直接投資
    5神事直人、京都大学
    6アウトソーシング、メリッツモデル
    7輸出企業、アウトソーシング、直接投資、多国籍企業、やさしい経済学
    8メリッツモデル、TPP、多国籍企業
  • 悪口ばかりでは悪いので,広めのマッチがうまく機能した例を紹介しておく。「テロ捜査情報、人気アニメ装い拡散」という記事(2010年11月27日朝刊)のキーワードは,
    「朝刊・夕刊」捜査情報流出、ファイル共有ソフト、警視庁、ウィニー、シェア、パーフェクトダーク
    2010/11/27 2:00電子版インターネット、ファイル共有、杉浦隆幸、パーフェクトダーク、捜査情報、人気アニメ、けいおん!!、警視庁、ファイル、テロ捜査、内部資料、ITセキュリティー、国際テロ、DVD、テレビアニメ、再公開
    となっており,キーワード「けいおん!!」は電子版にしか付いていない。では,電子版からキーワード「けいおん!!」を引くと,紙面は出てこないのだろうか?否。出てくる。ちなみに,「けいおん!」が日経本紙に載ったのは今回が4回目。
    • 記事検索「けいおん!」は「けいおん!!」にもマッチするが,逆はマッチしない。ワードロボは不明。

続「ワードロボ」 取りこぼし Edit

取りこぼしの典型は,ある記事のキーワードを引いたらヒット0になった,という挙動である。本来なら少なくとも自分自身は出てこなければならない。もしその記事が「朝刊・夕刊」とウェブ版(電子版)の両方に掲載されているのならば少なくとも2本は出てこなければならない*11。ヒット0ならおかしいと気づくが,そうでなければ取りこぼしに気づくのは困難だ。さらに言えば,偶々データベースの更新が遅れただけのこともあるのかもしれないが,それでは説明が難しい例もあった。「盆栽」というキーワードがある記事に付いていたので引いたら0になったことがある。翌日もそうだった。ところが,翌々日になると,自分自身2本(紙面とウェブ版)の他に多数の過去記事が出てきた。偶々データベースの更新が遅れただけなら,直近の記事が出てこないだけのはずである。また,0になるときでも,複数付いているどのキーワードでも0になるわけではないようだ。0にならないキーワードには自分も出てくる。これはデータベースの更新遅れ説に不利である。また,0になるキーワードを記事検索で引いたところ,元記事は出てきた(サンプルが少ないので,おそらく常に出てくるのか,出てこないこともしばしばあるのか,等までは不明。)。

  • キーワードに空白が含まれていると基本的に0になるようだ(補足あり)。バグだろう(キーワードが空白を含むことを想定していない)。例えば,「元気な山村 岐阜・加子母に住んでみる」という連載があるが,これに付いているキーワード「元気な山村 岐阜・加子母に住んでみる」(連載名と同じ)はヒット0になる(2010/12/7 AM 10:11確認)。なお,記事検索で「元気な山村 岐阜・加子母に住んでみる」を引くと,全文検索では全て出てくるが,キーワード検索では取りこぼしが幾つもある。
  • ある記事のキーワード「エコカー電池 始まった争奪戦」(それとは別に「エコカー電池」も付いていた)を引くと,実際には「エコカー電池」で検索された(ワードロボの画面でそうなっていた)。空白以降が脱落。これは別のバグだ。ただ,他の理由でも「元気な山村 岐阜・加子母に住んでみる」と差が出ているのかもしれない。連載記事・コラムは,連載名が「朝刊・夕刊」上では画像で表示されており,このため全文検索の対象から外れる,というバグがあるかもしれない(未確認)。「エコカー電池 始まった争奪戦」がバグにより「エコカー電池」で検索された場合は記事本文のどこかにマッチする可能性が高いが,「元気な山村」は本文にはマッチしないことが多そうだ。
  • 「S&P500種株価指数」で引いたら「Sの関連語はありませんでした.」。&以下は無視されたようだ。「M&A」も同じく。&はstop wordsなのだろう。だがそういう仕様がエディターに理解されていないし,そもそも設計ミスではないか。
  • 「STOCK α」は連載名としては空白が入るが,キーワードは「STOCKα」。それでワードロボで漏れなく拾えるようだ。また,「STOCKα」で,見出しのみを検索範囲に,完全一致で記事検索した場合も,漏れなく拾えるようだ。文中の空白は無視される?
  • 連載やコラムで,キーワードに連載名,コラム名を含まない場合,兄弟記事に移動するにはワードロボは使えず,記事検索を使う必要がある。いわば,兄弟は自分を見つけてくれるが,自分から兄弟を見つけることはできない。
  • Evernoteにクリップする際,連載名・コラム名をテキストでクリップしたいなら(全文検索のためにはそうすべき),その記事をワードロボで開いてそれをクリップする裏技がある(しかし限界もある。後述。)。

「ワードボロ」補足 Edit

その他,小さいことを列挙する。

  • ワードロボは直近10件の記事しか一覧されない。それ以上見せるなら課金したい,が日経の思いなのだろうが,現状は金を払って11件以上見る仕組みはないし,記事検索サービス(有料)との連携もない。課金できないからこれ以上コストをかけられず中途半端なシステム(キーワード付与方針の現状(上述)を含め)になっており,中途半端なシステムだから熱烈な支持者も増えない,という悪循環。
    • ワードロボに直接課金するのは難しいだろう。例えば,「くらし安心」面の「知りたい!そのデータ」という定期記事があるが,ワードロボ上では「知りたい!そのデータ」(サブタイトルなし)までしか一覧に出ないので中身が分からない。記事検索ならサブタイトルと,さらに記事の冒頭が出てくる。「知りたい!そのデータ 日付」だけで金を払うのは躊躇する人が普通だろう。
    • 11件以上見たいなら絞り込み(AND検索)を利用する手もある。ワードロボでは複数のキーワードをかけることができる。

  • ワードロボの一覧で,日付が「付」で終わるものは出典が紙面,そうでないものはウェブ版(ワードロボ内の表記では「電子版」),というのが基本パターンのようだ。しかし例外もある。「4:00」で終わっているものは紙面(朝刊),「15:30」で終わっているものは紙面(夕刊),のこともあるようだ。ただ,これはバグ絡みだと思う。後述「2010/12/21 7:00日本経済新聞 夕刊」参照。
  • 一覧は新しいもの順にソートされている。そして,一覧では朝刊と夕刊の見かけ上の区別はないのが原則。どちらも単に「付」で終わる。そのためだろう,夕刊記事は朝刊と一緒にその日の0:00の順位で出てくる。つまり,夕刊記事は,朝や午前中,昼過ぎにウェブ版に出た記事よりさらに前方に出てくる。使いにくい。(記事検索がそうなっているからだろう。)しかも,夕刊の記事が朝刊の前に来ることもある。(よく分からないが,SJISのコード順にソートされているのかも。表示はUTF-8なのだが。)
  • 「付」と「4:00」の両方が一覧にあり,両方とも朝刊のこともあった(無論,同じ内容。但し,図表の位置は異なった。)。「4:00」の方は開くと「2010/12/14 4:00日本経済新聞 朝刊」となっていた。「付」が東京最終版(いわば本物)かもしれない。さらに,同じ「4:00」が2つあり,開くと全く同一なこともあった。
  • 重複はちょくちょくあるようだ。これは間に別のものが挟まっている。

    あかつき失敗、宇宙開発後発組のジレンマ(2010/12/12 9:38)
    あかつき、どんな探査機?目的や搭載機器は(Q&A)(2010/12/12 9:38)
    あかつき失敗、宇宙開発後発組のジレンマ(2010/12/12 9:38)

    この順に並んでいるのはシステム的には意味があるのだろう。文字コードではないし,何だろう。
  • 「その日の夕刊が午前中にワードロボに出てきた」ことがある。朝10時にワードロボ上から「懐かしのヒーロー・CM 資料館にぎわう(2010/12/21 7:00)」を開いたら,出てきた記事の肩書きは「2010/12/21 7:00日本経済新聞 夕刊」だった。表記自体が矛盾している。しかも,この記事は3日前の夕刊の記事である。実際末尾に「[日本経済新聞夕刊2010年12月18日付]」と書いてある。数日前の夕刊のコンテンツをウェブ版に朝7時に出したのだろうが,バグにより属性表記がおかしくなっていると思われる。正しくは,ウェブ版上では「2010/12/18付」となる。(「2010/12/21 7:00日本経済新聞 夕刊」ではなく。)やれやれ,Evernoteに保存済のものにもこの間違いが潜んでいるかも。要注意だ。推測するに,「2010/12/14 4:00日本経済新聞 朝刊」の類もバグ含み(偶々実害がないパターンにすぎない)ではないか。記事の初出日時ではなく,ワードロボ等のデータベースに入ってきた日時を表示している臭い。
  • ここで要望を一つ。一覧される際,文字数が出るとよい。記事検索のように。そうすれば電子版(ウェブ版)と紙面の内容がほぼ同一か加除があるか当りを付けられる。
  • 外信の写真は表示されないことが多い。版権上の制約だと思われる。「保存」等も同様。後述版権参照。
  • 関連キーワードがないこともある。例えば,経済教室「やさしい経済学 空間経済学への招待(6)」。連載の5までは普通に付いていた。忘れた?
    • その場合,Evernoteに日付入りで保存する裏技(前述)を使うには,一旦前日の記事を開き,そこから当日の記事を呼び出す。
  • 関連キーワードは沢山付いていることもあれば少しのこともある。同じ記事の「朝刊・夕刊」と電子版とで大きく異なることもよくある。エディター次第。
  • 2010/11/21朝刊「インカ・マチュピチュ遺跡の発掘品、ペルーへの返還」のウェブ版には「エール、名門エール」という関連キーワードが付いている。「朝刊・夕刊」では「エール大」。名門エール?エディター次第。
  • ワードロボで開いたページは,URLが一時的・使い捨てであり,その不便・問題は前述した。付け加えれば,ワードロボの外のURLを見つけるため,その記事の本籍(電子版のどの場所に表示されているか)を探ろうにも,よく分からないことが多い。結局,同僚・知人にその記事を指し示すことができなくなる。(内容を全文コピペ,あるいはファイル化して送るのは著作権侵害になるケイスが多いだろう。)
    • 一番簡単な裏技は,Googleでその記事を検索すること。そうすれば外部から見えるURLが分かる。
  • ワードロボ経由で記事を開き,その記事を「保存」する。次に,その記事を「保存した記事」から開くと,ワードロボ支配下のURLが出てくるだろうか?さすがにそこまでタコではない。でも,もしかしたら,と危惧したほどURLは浮動的だ。また,ワードロボ経由で保存済の記事を,「朝刊・夕刊」から直接保存したら?「この記事は保存済です」と正常に反応する。
  • 「駐ロ大使、更迭へ 北方領土訪問の情報収集巡り」(2010/12/24付日本経済新聞 朝刊)をワードロボで開いたら,同じ写真が2枚表示された。「朝刊・夕刊」は正常。ワードロボへの情報の受け渡しにバグがあるのだろう。
  • 「『失われた20年』の時価総額増加率、1位はユニ・チャーム」(2010/12/25朝刊)のリードには「1位はユニ・チャーム、2位はトヨタ紡織、3位は日本電産」とある。他方,キーワードは「ユニ・チャーム、プロクター・アンド・ギャンブル、ホンダ、三菱UFJリース、スズキ、トヨタ紡織、HOYA、ケーヒン、失われた20年、時価総額」(「朝刊・夕刊」)。不公平では?本文では「日本電産や7位の三菱UFJリースなどは……」と2社が並んでいる。7位の三菱はこの1回しか言及されていないが当選。他方,3位の日本電産は都合3回言及されているのに選外である。さらに,記事には20位まで社名が出ているが,その大半は記事検索では引けない(後述の理由で,本文に名が出た社名以外は引けない。)。検索されないものは存在しない,の功罪がここにある。
  • ワードロボの釣果。日タイ貿易の記事の「タイ」を引くと,「インフルワクチン鼻に噴射は『予防効果高い』」(「鼻に噴射するタイプ」に適合),「『地球外生命』の期待、太陽系外にも」(土星の衛星「タイタン」に適合)が出てくる。随時更新。

ワードロボまわりはネタが尽きない。

キーワードによるアラート Edit

「自動記事収集」という機能があり,登録したキーワードが新着記事(紙面やウェブ版)にあるとメール通知が来る。ただ,ウェブ版独自コンテンツは検索対象となるものとならないものがある。「マネー」のカテゴリーに属しているものは対象外のようだ。(マネー下の記事は,記事の「保存」ボタンがないなど,他の電子版コンテンツと扱いが違う。)「ヘルプ」には特に注記がない。検索漏れがあることに要留意。

「自動記事収集」は5件まで,は少なすぎる。後述する「保存」機能が弱いので,それを補う手段が欲しいのだ。例えば,連載記事の第1回を読んで気に入ったので,忘れずに第2回以降も読みたいと思った場合,どういうアラート手段を使えるだろうか。現状では「保存」で我慢するしかない。メール通知機能のある「自動収集」で代用したい気持ちも強いが,こちらは5件までと制約が大きく多用できない。

  • 追加料金を払えば数を増やせるというのも十分ありだ。ただし,機能があと若干使いやすくなることが伴った方がお得感は増すだろう。現状は,機能的にも量的にも中途半端だ。中途半端なのは,コストを十分かけられないため。そういう場合は,APIを公開して,サードパーティーを呼ぶ込むべき。何でも内製化するのは非効率だ。事業者にとっても利用者にとっても。

検索漏れ Edit

記事検索について述べる。記事を,それが発表されたときに漏れなく目にする,というのはありえないし,電子メディアの時代に馬鹿げている。検索がまともに機能することが極めて重要になる。しかし,現状,全文検索しか当てにならないし(キーワードの実態について,前述ワードロボ参照),その全文検索すら検索漏れがある。通常,全文検索は全部出てきてしまうから困る代物なのだが,日経電子版では全部出てこないから困る。以下,述べる。

図表の中のテキストを検索できない Edit

「2010年活躍した弁護士ランキング」(2010/12/24付日本経済新聞 朝刊)に名前が載れば検索できるだろうか。意外にもできない。名前は表に一覧されているが,表の中のテキストは記事検索の対象になっていない。例えば久保利英明氏(6位)や葉玉匡美氏(7位)は検索上は選外である。記事本文に名が出た少数の人を除き,紙面のランキング上位1桁に名前が出ていても検索できない。(本文に全員の名前を出すなら,表は要らないし,それではきわめて読みにくい記事になる。)検索されなければ存在しない,はネットの負の側面だが,それが日経にもある。「ボスの名前が出ていない」は早合点かもしれない。

  • 東京・首都圏経済面の「首都圏けんてい・どこでも探検隊」は「けんてい」(検定)を記事の特徴にしている。検定問題が出される。しかし,「朝刊・夕刊」では検定部分(課題)は画像になっており,そのためか,記事検索でも課題文を引くことはできない。テキストデータとしては記事データベースにも載っていないのかもしれない。
  • 「朝刊・夕刊」で,ごく普通の見出しをクリックすると,いきなり画像に飛んだこともある。記事全体が一つの表の場合,全部が画像なのでそういう次第になったのだろう。この場合,一つの記事が丸々記事検索の対象外ということになる。2011/1/4付朝刊の「小売店からみた『これが売れる』 本社調査」。記事検索では,見出しで引くことはできるが,記事属性を見ると本文が全くないことを示唆する状態になっている。

まとめれば,紙面では表の中だろうが,本文であろうが,文章は文章であるが,記事検索では図表の中か本文かで扱いが異なる。ただ,この問題は日経電子版ではなく日経テレコンの問題だろう。

  • 図表は本文の理解を助ける単なる補助ではない。本文に内容を書き出すと箇条書きになってしまうのを避けて一覧にまとめたケイスが過半ではないか。会社名が表の中にしか出てこないこともある。その場合,記事検索して「ウチの会社は日経に載っていない」は早合点になる。
  • 仮にデータベースを接続して検索できるようになっても,検索漏れは残りそうだ。例えば「ノーベル平和賞授賞式の欠席国」という表(電子版ではHTMLで組まれている)のテキストは「中 国」,「ロ シ ア」と空白が入っている。「中 国」は間に2つも。画面上の見た目を少しでも改善しようという健気な意図だろう。エディターはマークアップ言語という概念への理解を欠くし,自分でHTMLを書いた経験も非常に乏しいのだろう。

図表は「朝刊・夕刊」では基本的に画像で表示されるが,前述の通り,ウェブ版に同じ記事が掲載された場合は,図表がHTMLのテーブルで組まれていることがしばしばある。しかし,たとえウェブ版でHTMLのテーブルで組まれていても,次のいずれにおいても記事検索の対象となっていないようだ。(1)「朝刊・夕刊」のコンテンツがWeb刊等に表示されている場合*12,(2)「朝刊・夕刊」と同一記事だが本籍はウェブ版である場合(属性表記が「電子版」になっている場合が典型),(3)そもそも電子版独自コンテンツ。内部のデータベース上の属性で「表」になっていれば,画面上に最終的に画像として表示されていようがテキストとして表示されていようが記事検索の対象とならないようである。

  • 「活躍した弁護士ランキング」は「日本経済新聞朝刊連動」と称して電子版(ウェブ版)の「マネー・マーケットonline」にも掲載された(タイムリー・ランキング)。紙面に「各部門のランキング詳細を電子版『マネー・マーケットonline』に。」との一文があるのを受けている。続きはウェブでの類。ところが,「朝刊・夕刊」にはこの案内は全くないし,リンクも全くない。紙面と電子版の連携は存在するのに,電子版同士の連携が存在しないケイス。電子版内の縦割り。さらに,「マネー・マーケットonline」は日経電子版の下にはあるが独立の別メディアのようであり*13,色々挙動が違う。例えば記事検索の対象になっていない。紙面にはランキングの一部しか載っていないが,電子版には25位まで載っている。しかし,結局,記事検索では検索できないのである。

ハイフン Edit

全角ハイフンを含む語を記事検索で引いても,意図した結果を得られないことがある。技術的なことなので結論だけ言うと,全角ハイフン(ダッシュを含む)の混乱を記事検索プログラムは考慮していない(2010年12月1日時点)。プログラムは汗をかかず,人間が汗をかく仕組みなっている。しかし,プログラムは人間の代わりに汗をかく仕組みではないか。とりわけ日経電子版のような,文字コードの専門家でない,広く職業人*14が使うシステムの場合は。……それにもかかわらず現状は,全角ハイフンを含む検索語を的確に引けるかは利用者のリテラシーに委ねられている。

検索語とヒット数Unicode名称簡単に言ってどういう文字か(どういう意味か)
GFAJ–10Funds–i0全角U+2013EN DASHenダッシュ
GFAJ—10Funds—i0全角U+2014EM DASHemダッシュ。全角ダッシュ
GFAJ―14Funds―i2全角U+2015HORIZONTAL BAR欧文で会話文の「」に相当する使い方をされる。Quotation dash。和文でも2本つなげて似た用法をする(下記参照)。日経もその用法で使う。しかしいずれにせよハイフンの意味ではない。
GFAJ-11Funds-i0全角U+FF0DFULLWIDTH HYPHEN-MINUSハイフン,マイナス。どちらの意味でもよい(そういう文字)。
GFAJ-11Funds-i0半角U+002DHYPHEN-MINUS上記と全く同じ(その半角)。
GFAJ‐10Funds‐i0全角U+2010HYPHENハイフン。「ハイフン(四分)」(JIS X 0213:2004の日本語通用名称)。
GFAJ−11Funds−i0全角U+2212MINUS SIGNマイナス

なお,日本語や英語の常識として,ハイフンとダッシュは意味が違う。過去にはコンピューターの使える資源が非常に乏しかったこともあり,代用され一緒くたにされることもあったが,いまは違う。我々はもう貧乏ではない。

過去の経緯は兎も角,今日ではハイフンを全角で書くときはU+FF0Dで書く(そう変換される)のが普通だろう。しかし,それで検索すると,上記のように利用者の意図した結果にはならない。日経電子版では全角ハイフンにU+2015 (HORIZONTAL BAR) が使われている。このずれをプログラムが吸収するのは非常に簡単(極めて簡単)なのだから,システムを修正すべきだ。どちらが正しいのかの議論は,職業人には必要ないし,ましてやコンピューターに合わせる必要などさらさらない。

  • HORIZONTAL BAR(ホリゾンタル・バー)を和文でQuotation dashの意味で使う例。日経本紙もこういう使い方をする。インタビューで

    ――正しいフォームで走っているか否かはどう判断すればよいですか?(記者の質問)

    「足音がばたばたと五月蠅いかどうかは一つ参考になります。」(相手の回答)

    ――どうしてですか?

    「足の裏全面でべたっと着地していると音が大きくなります。」

    両方とも「」で囲むと混乱するからだろう。パソコン画面上では2本のHORIZONTAL BARはつながって見えることも多いが(それは環境次第である),紙面では少し離れている。HORIZONTAL BARの他の用例としては,論旨の展開に少し間を置く(一呼吸置く)用途がある。これは漱石にも多用されている。

stop words Edit

夕刊に「ところ変われば・・・」という連載がある。本にもなっている人気連載である(Amazon.co.jp: ところ変われば : 日本経済新聞社)。朝日の「特派員メモ」をもっと長くしたものに相当する。連載名は以前は「ところ変われば」,2010年3月15日から「・・・」付きに変わった。ただ,エディターは「・・・」と書いていることもあれば「…」のこともあり,馴染んでいないようだ。(なお,ブラウザー上で点の高さ位置が中央に見えるか下部かは,フォントのデザインの違いであり,字の違いではない。)この半年で

回数
ところ変われば・・・19
ところ変われば…3

という揺れがあり,直近を見てもまだ固まっていない。「ところ変われば」で検索すればこの両方が出てくる。ところが,「…」付きで検索すると0になる(2010/12/27 PM 4:38時点)。「…」はstop wordsのようだ。ただ,stop wordsという概念を知っている利用者がどれほどの割合いるのだろうか。実際,直近(2010年12月27日)の「ところ変われば・・・」には「ところ変われば…」というキーワードが付いていたので,ワードロボではヒット0になった。社内的にも知られていないようだ。

実数検索数
ところ変われば・・・1919
ところ変われば…30

キーワードによる記事検索 Edit

各記事にはキーワードが付いており(ワードロボで使われる「関連キーワード」がそれである。),記事検索では,キーワードのみを検索範囲として検索することができる。しかし,これに多くを期待できないことは前記ワードロボの項を参照。

その他いまいちな点 Edit

  • 「朝刊・夕刊」ではコラムや連載のタイトル(「春秋」等)が画像ファイルになっている。このためブラウザーの検索欄にコラム名を入れて,ページ内を移動することができない。さらには,Evernoteにクリップした場合,画像のままだと後日,連載名・コラム名で記事を検索できない。連載名・コラム名はブランドであり,日経はブランド名を高める工夫をすべきなのに,ブランド名で検索できないのは,なすべきこととやっていることがちぐはぐである。
  • 裏技:その記事をワードロボで開いてそれをクリップする(前述)。しかし限界もある。ワードロボの挙動を参照。特に,「経済教室」のような大項目名が落ちてしまうのも困る。後日,Evernoteで「経済教室」を検索しても見逃すことになる。これはイタイ。
  • ある読者が「経済教室」を見逃すまいと,自動記事収集に登録しておき,新着メールに応じて目を通し,Evernoteに経済教室を保存したとする。こういう利用は特に特殊ではないだろう。しかし,通常,そうして保存したノートには「経済教室」の語がどこにも入っていない。そのため,後日,Evernoteで「経済教室」を検索しても漏れてしまう。「経済教室」は「企業」面,「社会」面等の面名と同じ扱いのようであり,自動記事収集等で個別記事を見た場合は画面に表示されないのである。「ワードロボ」で前述したのと同じ事情である。
    • 2010年最後の「経済教室」は「企業経営の課題」と題する前後編からなる論考だった。12月30日の分は「朝刊・夕刊」のみならずウェブ版にも掲載された。この際の見出しは,「強い日本復活へ リーダーの世代継承を(経済教室)」のように「経済教室」が入っていた。このように入っていれば,後日,検索に漏れることもない。本来,「(経済教室)」の有無などはどうでもよいことのはずだが,そのどうでもよいことが利点になってしまう困った状況がある。
      • 2010年12月30日の掲載(金井壽宏・神戸大教授「強い日本復活へ リーダーの世代継承を(経済教室)」2010/12/30 11:16電子版)にはミソが付いた。「ポイント」(要約)が間違っている。別の日の要約が間違って挿入されている。(紙面並びに「朝刊・夕刊」は問題ない。)面白いことに,現時点の内容(ポイントの内容)で記事検索してもヒットしない(2010/12/30 PM 7:28)。記事検索データベース上は存在しない「幽霊テキスト」が現在表示されている(本文なら期待通りに検索できる。)。もしかしたら,記事データベース上の内容と,画面上の内容がずれているのかも。追記。結局,2011/1/4付朝刊の経済教室(D・ストロスカーン氏)のポイントが挿入されていたことが判明。その時点で未掲載だから検索しても出てこないわけである。
  • 過剰自粛(著作権)がときに見受けられる。例えば,「バイクナンバー 地元仕様に変身 長野・松川町、ナシ・リンゴ 岡山・総社市、雪舟にちなんでねずみ形」(2011/1/4付朝刊)という見出しを見れば,紙面に実物の写真が載っているさまが容易に目に浮かぶ。しかし「朝刊・夕刊」では断りなく割愛されていた。「割愛しています」という表記もないので,なんて不便な記事だと思った不満屋だけが「紙面ビューア」を開いて写真を見ることができる,という演出らしい。ナンバープレートの意匠権や著作権を気にして非掲載にしたのだろう。しかしこれは新聞の自殺行為だ。新聞社は著作権上の特権(41条)があるのに,使うのを自粛している。特権は使わなければなくなってしまう。いつまでもあると思うな親と金。

Evernoteでクリップすると背景で本文が読めない Edit

2011年 4月24日頃からか,背景の色(背景画像)で本文が読めなくなることがある(Chorome用extention使用。他は不明。)。以前から(と言っても2月頃からだったか),背景に余計な画像が入り込むことがあったが,それがさらに酷くなり,かなり広い範囲で本文が読めない状態になる。Everenote側の改良を待つしかないのだろう。当座の対処としては,クリップ前にjavascriptでページの背景を消す手がある。(2011年 4月24日記載)

「保存」 Edit

記事を「保存」しておくことができる。電子メディアでは定番の機能だが,まだまだ工夫の余地はある。例えば,連載記事の1回目を読者が保存したなら,明日の2回目を読み忘れないようにとの意図で保存したのかもしれない。つまり,保存記事を軸にした新着記事アラートもあるとよい。単なる簡易な切り抜きと位置づけるのは勿体ない。単なる定番機能の位置づけに留めなければ,用途は広がる。

  • 保存記事に分類ラベルを付けることができる。特定のラベルを付けた記事のみを表示させ,その内の一つの記事を「削除」するとどうなるだろうか?保存記事から消えるべきだと思うのだが,ラベルが消えるだけのようだ。従って,ラベルで記事を絞り込んで,その状態から記事を削除するには2ステップ要する。しかも,ラベルを削除した段階で他の記事の中に埋もれてしまうので,探し出す手間も要する。作った人もその上司もこの機能を使っていない,と思わせるタコな仕様。そもそも,全てが一覧されているとき,各記事にどういうラベルが付いているのかも分からない。開発途中でリリースされ,放置状態なのだろう。

なぜ直接,日経に言わないの? Edit

ここに書いた不満をなぜ直接日経に言わないのだろうか?

要望・質問を送りにくいからである。日経新聞電子版のカスタマーサポート(「問い合わせ」)は,フォームの入力項目が多すぎる。一つのフォームであらゆる内容を受け付けようという「汎アメリカン主義」の設計方針からそうなったのだと想像できるが,読者としては面倒でしょうがない。読者(消費者)目線欠如の最たるものだ。顧客志向ではなく,技術者志向(あるいは顧客サポートの手間を,顧客の負担で減らす志向)でインターフェースが作られている。わざわざ要望を出すユーザーをもっと大事にすべきだ。スーパーに,買物が少ない人向けの特設特急レジがあることがあるが,そういうのが欲しい。(2010年11月 7日)

個々の顛末 Edit

「FireFox 3.6で「朝刊・夕刊」を見ると画面レイアウトの一部がおかしい」と先日カスタマーサポートに連絡した際は,「サポートする利用環境」が書かれたページのURLを書いて,そこをご覧下さい,という非常に簡潔至極な返事が返ってきただけだった(2010年10月 7日付け)。そのページを見ると,FFは3.5までしかサポートしないようだ(2010年11月 7日時点でもそうなっている。)。しかしFFの製造元が3.5はobsoleteであり,3.6に移行しろと宣言して久しい。(2010年8月でサポート終了というのが当初の発表だった。現在,暫定的に延長されているが。)それでも日経は,3.6を使っている人の言い分は一切聞きません,式の対応をする。

その他 Edit

「2010/○/○付」 Edit

記事の日付が「2010/11/19付」あるいは「2010/11/16付 日本経済新聞 夕刊」等,「付」があれば,出所は(ウェブ版ではなく)紙面である。(つまり「朝刊・夕刊」と同じコンテンツである。)他方,「付」がなく,時刻まで記述されていれば出所はウェブ版である。これが基本パターンのようだ(補足あり)。

  • しかし,「2010/11/19付」は朝刊なのか夕刊なのか分からないという大きな欠陥がある。さらに言えば,「朝刊」と書いてあってもどの面に載ったのか分からない。1面に載せるか,企業面に載せるかは,新聞ならではの価値創造だ。付加価値を自ら捨てるのは勿体ない。現状では図書館で縮刷版を見る必要がある。これでは原始人である。

さて,「付」が付いている記事,即ち,本籍が「朝刊・夕刊」のコンテンツは「朝刊・夕刊」の領域の外でも普通に目にする。「朝刊・夕刊」の領域は有料契約者限定だが,そうではないWeb刊等を普通に見ていても「朝刊・夕刊」のコンテンツをしばしば目にするのである。前述の通り,電子版には2種のメディア(「朝刊・夕刊」とそれ以外)があるが,表示される場所は重なっているのだ。「朝刊・夕刊」とウェブ版の垣根,即ち電子版内の垣根はかなり低い。

この垣根の低さは,コンテンツの表現を柔軟にする上でも役に立っている。例えば,総論+2つの各論,のような構成の記事(特集記事に多い。例えば,二人のインタビューからなる記事。)は,「朝刊・夕刊」ではバラバラの記事に分割する方針のようだ(いわば分割主義。データベースの厳格性が背景にあると思われる。)。分割されているので,「次の記事へ」や関連記事のリンクで読み進める必要がある。読む上でもクリップする上でも不便。だが,その記事が「朝刊・夕刊」の外に出てくると,1枚の記事にまとめられる(こともある)。紙面をウェブに再現するのが狙いの「朝刊・夕刊」より,紙面の利便性(一覧性)に近くなるのは皮肉だ。このように「朝刊・夕刊」は表示形式に硬直性がある。

  • 「朝刊・夕刊」で,勇ましい見出しの記事を開いたら,単にリードだけ,ということもある。分割主義なので。肩すかし。インタビューなら分割されていてもまだ納得できるが,時には「一つの記事」が小見出し毎に分割されていることもあり,非常に読みづらい。例えば,2010/12/27朝刊「経済」面のエコノフォーカスは,紙面ではたかが右3分の1を占めるにすぎないのに,「朝刊・夕刊」では4つの記事になっていた。ウェブ版では一つにまとまっていた(2010/12/26 22:01)。

変則ギャラリー Edit

ところで,日付の書式は上記パターンに当てはまらない(矛盾する)こともある。例えば,ある記事の「関連記事」の一覧に次のような項目があった(一部引用)。

  1. 日経電子版「6カ国協議再開で韓国、哨戒艦事件謝罪は条件とせず 」 (2010/11/9 1:17)
  2. 日経朝刊6面「北朝鮮首相が訪中、農業施設や企業を視察」 (2010/11/3付)
  3. 日経夕刊2面「中国軍幹部と金総書記会談 地域安定へ友好確認」 (2010/10/26 10:29)

1番目は「電子版」と名乗り,日付が時刻まで載っている。互いに整合している。2番目も同様に名乗りと日付の表記が整合している。しかし,3番目は整合していない。記事を開くと「付」はない(もし時刻「10:29」に「付」が付いたら破格に思える。)。上記例は同一の記事に付いたものである。幾つかの記事を見渡したところこのような幾つかのパターンを集めることができた,ではない。一つの記事に複数のパターンが混在していた。

  • パターンのメモ
    • ワードロボ経由だと「日本経済新聞 電子版」や「2010/11/20付 日本経済新聞 夕刊」になる。「自動収集記事」,「保存記事」も同様。ワードロボの兄弟ということか。
    • 「関連記事」経由だと「2010/11/18付」で終わる。
    • 一覧の時刻が「4:00」のもの(例えば「(2010/11/18 4:00)」)はウェブ版のこともあれば朝刊のこともある。時刻「15:30」は夕刊のこともある。ワードロボも参照。
    • 「2010/11/24 4:00 日本経済新聞 朝刊」という形式もある。
    • 「2010/12/21 7:00日本経済新聞 夕刊」を見た。これは色々な意味で単なるバグだ。ワードロボの項参照。
      • 「2010/12/24 10:19日本経済新聞 朝刊」をワードロボで見た。中身は朝刊(重複エントリーの例。「2010/12/24付日本経済新聞 朝刊」)と全く同じだった。
      • 「2010/10/26 7:00日本経済新聞 朝刊」を見た。もう驚かない。元記事が紙面に載ったのは2010/10/24(朝刊)であり,このタイムスタンプは間違えている。バグである。記事検索では2つが互いに自分が本物であるかのように競っているが,新聞という性質上,若いものは形勢が苦しい。若い方の末尾には「[日本経済新聞朝刊2010年10月24日付]」とあった。自分は偽物ですと自ら言っている。
  • 同じテーマの過去記事を集めて電子版上で仮想特集を構成した,という感じだろうか。紙面の過去記事が,肩書き「2011/4/21 12:45日本経済新聞 朝刊」等――その日の紙面には実際は載っていない――で電子版に掲載されることもある。紛らわしいが,企画自体は歓迎だ。記事が埋もれてしまうのを避けることが出来る。新聞は毎日記事を量産する。読者は見落とすこともあるし,重要性に気づかないこともある。再構成により発見も多いだろう。例えば,「長期分散投資、リバランスのすすめ」という見出しの記事は,肩書き「2011/4/21 12:45日本経済新聞 朝刊」,末尾「[日本経済新聞朝刊2011年2月20日付]」で電子版に再掲載されていた。なお,実際の紙面では見出しが一字違い,「長期分散投資 リバランスのすすめ 」だった。そのため,Evernoteでは検索に引っかからなかった。記者は小国由美子氏。

右クリック禁止 Edit

登場当初,右クリック禁止という時代遅れの仕組みが内外から揶揄されたが,有料会員になると右クリックの制限はない(全てのページで制約は存在しない。)。

事例のメモ Edit

2つのメディア,2人のエディター Edit

  • 2010年11月26日朝刊に「エコポイント、駆け込み過熱」という記事が載っている。電子版(ウェブ版)では「エコポイント駆け込み過熱 TV購入、数時間待ちも」という見出しになっている(2010/11/26 9:04閲覧)。ウェブ版のこの見出しはエディターの勇み足だ。この記事の中にはレジ待ちが数時間待ちという話は全く出てこない。(納品が数ヶ月先という話は出てくる。)レジ待ちの話は数日前の記事(23日朝刊)にあり,それに引きずられたと思われる。逆に言うと,紙面のエディター(編集)の方が職人として一枚上手ということになる。
  • ある日の朝刊に,「首相『公邸と官邸、実はつながっている』」という見出しがあった(2010年11月26日朝刊)。耳目を惹きつけるよいコピーだ。ところが,電子版では「政府の危機管理、甘さ露呈 北朝鮮砲撃」であり,これでは目にしない人も多いだろう。コピーの出来はエディター次第。なお,アクセスランキングの上位に来たのは前の記事だった(26日9時現在,4位)。(アクセスランキング「総合」部門は「朝刊・夕刊」やウェブ版を横断的に一覧する。同じ記事なのに,有料会員しか読めない前者が,無料会員も読める後者を上回ることも少なくない。これを素直に受け取って,見出しの力は大きい,と驚いてよいのか,それとも,別の理由がある,例えば,「同じ記事」は「朝刊・夕刊」に合算されることもあるのか,よく分からない。)
  • 日経に限らず,新聞サイト編集部は読者の行動を分析しているはず。研究者には垂涎の情報だろう。そうした職人技が社外秘として埋もれていくのは勿体ない。社外秘としても他社と「営業成績」で差を付けることに役に立っているとは思えないし,そもそも上記のように,社内的にも十分に技が承継されているとは言い難い。商品化できないものか。
  • 商品面に「鶏卵のイロハ」というミニ連載があった。2回目の見出し(紙面)は「ケーキやおでん、年末に需要」(2010/12/23付日本経済新聞 朝刊)。電子版では「鶏卵、おでんにケーキに… 11~12月は引く手あまた」。さて,紙面の特定の面(例えば商品面)に載るというのは,既にその時点で一定の見込み客を掴んでいるので,その客層のみを相手にすればよい。しかもその商店(面)の目玉商品より目立つのは失策である。他方,電子版では(特に日経では)横一線なので見出しが拙ければたちまち沈んでしまう。こんな事情はあるのだろう。
  • 特許庁が奈良で日中韓とインドネシア、マレーシア、シンガポールの6カ国シンポジウムを開いた,という記事が2010/12/4の朝刊と,前日夜のウェブ版に出ている。朝刊の見出しは「(短信)日中韓など知財保護強化を議論」,ウェブ版の見出しは「知財保護強化を議論 特許庁がアジア6カ国シンポ」。さて,どちらの見出しが優れているだろうか?私は前者の記事を読み飛ばした。日中韓の特許当局の交流はもう日常茶飯事であり,ニュース性が低いと思ったから。しかし,「アジア6カ国シンポ」となると話がかなり異なる。

編集の自由度 Edit

  • 「ホテル客室数、旅館抜く 都市観光・ビジネスで需要」という記事(電子版2010/11/18)には「宿泊施設の区分」という用語解説記事が付いている。ウェブ版ではこの用語解説記事へのリンクは「旅館とホテル、どう違う?」という名前になっている。「旅館とホテル、どう違う?」をクリックすると上記「宿泊施設の区分」が出てくるのである。導線として実にキャッチーである。些細なことだが,ウェブ版のエディターの裁量だろう。だが,「朝刊・夕刊」ではこうした工夫は許されないようだ。勿体ない。(ホテルが旅館抜いたという記事は紙面では19日朝刊に載っている。)

3人のエディター? Edit

  • 三洋電気が「GOPAN」の受注を一時停止したという記事(2010年11月25日)は
    11:54 (日経QUICKニュース)
    12:59
    21:15
    の3本がWeb刊に出ており,それぞれ独立の記事として扱われている。基本的な内容は同じだが,文章は別々に起こされたと思われる。夕刊は12:59をベースに,多少短く書き直した文章が出ている。部署が違うので3本も出たのだろうか?
  • その後,翌日朝刊にも基本的に同じ内容の記事が載った。21:15の文章そのまま。夕刊チーム(総合・ビジネス面)と朝刊チーム(企業面)が別々に動いている?

「朝刊・夕刊」には載るが,検索できない記事 Edit

記事を「保存」して,後刻,本文を見ようとすると,本文を表示できないコンテンツがある。版権絡みだと思われる。例えば,ウィリアム・J・ペリー氏の「私の履歴書」がそういう扱い。「朝刊・夕刊」では読むことができる。しかし,当日の「履歴書」を保存し,その場で開いても,本文を表示できない。表示されるのは見出しまで。さらに,「朝刊・夕刊」上では本文の下に「バックナンバー」が一覧されているのだが,そこを開いても同じように本文だけ読めない。前日の「バックナンバー」でも同様(ただし,「朝刊・夕刊」の日付を切り替えればその範囲では過去記事を読むことができる。)。

  • 「保存」とは日経電子版のそれである。Evernote等への保存に支障はない。
  • 若干面白いのは,画面上は,0文字からなる本文を通常どおり無事表示しました,他と何も変わりはありません,という体裁になっていること。本文を表示できないことについて何も断りはない。「著者との契約により表示できません」のような紙面本文にない文章を差し込む仕組みが,システムに具わっていないのかもしれない。
  • 記事検索でも本文は検索対象になっていない。本文で検索しても引っかからない。見出しで引くことはできるが,記事属性で本文は「0文字」となっている。
  • ワードロボ経由でも,一覧には出てくるが,本文が0文字になるのは全く同じ。そのため,ワードロボ経由で記事を開き,記事に日付を入れるという前記裏技が使えない。
  • 同じ理由だろう,外信の写真は「朝刊・夕刊」では表示されるが,ワードロボ等では表示されないことがあるようだ。しかも,「朝刊・夕刊」とウェブ版(電子版が本籍)に外信の写真が出ていても,ワードロボや「保存」,「自動記事収集」,「おすすめ」では表示されないこともある。単に「電子メディアに掲載しない」「する」という契約なのではなく,それ以上にワードロボ等は版権契約上,扱いが異なるのだろう。さて,読者は,「朝刊・夕刊」やウェブ版より先に「自動記事収集」や「おすすめ」で記事を見たなら,その後,「朝刊・夕刊」やウェブ版の同じ記事は読み飛ばすのが普通だろう。その場合,記事の一部を見る機会が失われることになる。《ウェブ版で図表が割愛されている》問題と同じことがここにもある。記者は「外信の写真はおまけ」とは考えていないはずだ。記者の意図が読者に一部伝わっていない。契約上,制約があること自体は仕方ないとしても,問題は,記者の意図が一部伝わっていないことではなく,伝わっていないこと自体が伝わっていないことだ。
  • ギャラクシープレス提供・APの「アンリ4世の肖像画とミイラ化した頭部の写真」(2010/12/29付朝刊。2010/12/28 21:52電子版)は,当初はワードロボ等で出てこなかったが,翌朝になったら出てくるようになった。

電子メディアには収録しない。記事検索の対象にすらならない。例外は「朝刊・夕刊」のみ。という契約カテゴリーがあるのだろう。(連載小説のように,「朝刊・夕刊」にすら載らないコンテンツもある。)ただ,こういう扱いの記事は多くはない。外部執筆者の内,作家では多いのかもしれないが,外部執筆者コンテンツの代表である「経済教室」は特にこういう限定はないようだ。経済教室のコンテンツは,時に,無料会員も読める場所にも掲載される。個別契約とエディター次第だろうが。

  • アサヒ・コム パーフェクトや聞蔵IIビジュアルでは,外部執筆者のコンテンツなど,版権上表示できないコンテンツも検索の対象になっていた。ただ,連載小説も全文検索できたかは覚えていない。
  • ただ,エディターが経済教室のコンテンツを十分に活かしているかは疑問。偶に利用されているが,埋もれていることの方が圧倒的に多い。例えば,「新防衛大綱『動的防衛力』を提唱 中国に警戒感」(2010/12/5 22:10電子版)ならば,その先週に掲載された「やさしい経済学 多国間協調のゲーム理論」(岡田章・一橋大学教授執筆)へのリンクがあってもよいだろう。若い読者を紙面に誘うには,地道に仕掛けを蒔き続けるしかない。リンクを貼ることは人を育てることでもある。エディターとロボットの違いでもある。
  • 経済教室をまとめて紹介する「(今週の)経済教室まとめ読み」が電子版に出ることがある。しかし2010/12/19で2回目のようだ。「まとめ読み」とは別に,ヤフー・グーグルの独禁特集もあった。

紙面と「朝刊・夕刊」の文章が違うこともある Edit

「日経実力病院調査」(2010/12/16夕刊)には「実力病院のより詳細なデータを電子版『ライフ』で掲載します。」という一文がある(紙面)。「続きはウェブで」の類である。面白いことに,「朝刊・夕刊」では「電子版」が取られて単に「……データを『ライフ』で」になっていた。現在地が電子版だから重複になると考えたのだろう。細かいが律儀だ。(最初は「日経ライフ」という雑誌があるのかと思ったが。)「朝刊・夕刊」のエディターが個別に削っているのだろうか。しかし,電子版「朝刊・夕刊」から電子版「ライフ」へのリンクにはなっていなかった。紙から離れられない「朝刊・夕刊」。

  • 他の例。紙面「インタビュー全文を電子版に」→「朝刊・夕刊」「インタビュー全文をweb刊『連載・コラム』に」。これはリンクになっていた。

その他 Edit

  • アクセスランキングには,表面上,明らかな矛盾がしばしばある。例えば,「総合」1位(総合は電子版(ウェブ版)と「朝刊・夕刊」を合わせたランキング)になっているのは「朝刊・夕刊」の記事(日時に「付」がある)なのに,その記事は「朝刊・夕刊」のランキングでは1位どころか7位,というようなことがある。電子版(ウェブ版),「朝刊・夕刊」通じて「同じ記事」は「付」に合算して集計されることがあるのかもしれない。確かに,アクセスランキングではこのように一つにまとめた方がよいとは思うが,「同じ記事」の内容が全く同じとは限らないことは前述の通りである。しかし,仔細に観察して見ると,原則合算というわけでもないようだ。挙動がよく分からない。
  • 記事検索でウェブ版の記事が検索できるようになるのはそれほど速くないが,「朝刊・夕刊」の記事はそれほど遅滞なく検索できるようになる。例えば,ウェブ版の時刻が12:02の記事のある記事は17時の時点でまだ検索できなかった。紙面(夕刊)に載った同じ記事は検索できた。
  • 記事のすぐ下に出る関連記事一覧(名前のない一覧)には,通常,各記事の日付が添えられている。しかし偶にないものもある。メディアが違うのが理由のようだ。例えば,「ビジネスリーダートップ > コンフィデンシャル > コンフィデンシャル > 記事」へのリンクには入っていなかった。
  • 同一IDで複数の同時アクセスはできないが,同一PCの別ブラウザーで同時にアクセスすることはできる。また,同一PCか否かはIPアドレスで見ているのではない。グローバルIPは同一でも,別のPC(社内IPが別)なら同時アクセスはできない。
  • 「銘柄フォルダー」(ポートフォリオ管理ソフト)が「,」(桁区切り)の付いた数字を受け付けないのは,利用者(消費者)目線の欠如。利用者がポートフォリオ管理ソフトに数字を入力する場合は,どこか自分が契約している証券会社の画面からコピペするのが普通だろう。その画面の数字にはほぼ確実に,が付いているはずだ。いちいち,を取って入力していると,さしずめ気分は原始人である。繰り返し同じ作業をする手間を省くためにプログラムというものは存在する。人間に毎回手作業で,を取り除かせるのは,プログラムの本性に反する。「銘柄フォルダー」のプログラマーは,数字に,が付いていようがいまいが数字として認識するようプログラムすることは容易にできる*15。しかし,利用者目線に立たない限り,プログラマーが楽をして利用者が苦労していることに,彼らが気づくことはない。……先日,このように日経電子版のカスタマーサポートに諄々と説いたのだが,その後も変わりないようだ(2010年12月15日現在)。
  • 電子版(ウェブ版)の記事はおおむねどれくらいで閲覧できなくなるのか。それは調べていないが,翌日に閲覧できなくなったものもある。……しかしそれは随分速いな。もしかしたら撤回されたのかも,と思って記事検索してみたところ,そこには出てきた。「芥川賞、ノーベル賞 受賞者の出身高校は」(2010/12/10 4:00)がそれ。テーマ的には紙面に載ってよさそうだが,紙面どころか翌日気づいたときにはウェブから消えていた。Googleにも痕跡がない。クロールされる前に消えた?当日に既に消えていた可能性もありそう。確かめようがない。
  • ペリー氏の「私の履歴書」第12回(2010年12月12日掲載)。文中ROMとあるのはRAMの間違い。原稿の間違いか翻訳ミスか不明だが,かなり初歩的知識であり,見逃したエディターの落ち度は大きい。言うまでもないことだが,編集は内容の間違いを作家の責任にできない。誤植ではない(ROMの語義が付いている)ので,著者が修正を求めなければ「訂正」されることはないのだろう。
  • 「マネー」の「見られたコラムランキング」はたまに不自然なものが上位に来る。いま(2010/12/13 PM 4:59)は「ドルのワナ」が3位に(その後2位に)来ている。1年以上前の,しかも非常に短い文章。以前気になったときは「オランダ病」だった。オランダもそうだが今回も,GoogleやTopsyで見ても被引用は0なのでどこか有名なサイト等で引用されているわけでもなさそうだ。バグ?
  • 図表が,紙面では単色だが,電子版ではカラーのこともある。紙面以外のメディアへの転載を当初から想定して図表を作っているのだろう。ただ,色使いを見るとウェブ向けというより紙メディア(コート紙?)向けに思える。
  • ノーベル化学賞を受賞した鈴木章・北大名誉教授が,本物のメダルとレプリカの区別を誤ったエピソードに関して,朝日は鈴木教授が「化学者失格」と発言したと報じ,日経は「科学者失格」と報じた(2010/12/14朝刊)。これは日経が正しい。鈴木教授は比重をネタにしている。これは物理であり,化学ではない。同音異義語であり記者・デスクは聞き分ける必要がある。c.f. http://twitter.com/7PB/1428134...
  • 大昔からの慣行なのだろうけど,共同通信配信の記事であっても,国内記事に関しては,紙面(「朝刊・夕刊」も)では共同のクレジットは入らないことがあるようだ。(いわばOEM製品。)ウェブ版では同じ文章にクレジットが入っていることがあるのでそれと分かる。また,紙面でも,社会面には入らない,スポーツ面には入る,というような一定の取り決めがあるようだ。業界常識なのだろうが,消費者には分かりにくい。どれくらいの比率を占めるのか,研究論文もあるのだろう。
  • 日経電子版のコンテンツでありながら,記事扱いではないコンテンツもある。「ニュース発掘7days」は「(今週に)掲載された様々なニュースからWeb刊編集デスクお薦めの記事を紹介します。」というもの。これは記事検索には収録されない。固有の居場所(毎週ここを見れば見つけることができる)もないようだ。似たようなコンテンツだが,経済教室をまとめて紹介する「(今週の)経済教室まとめ読み」は記事扱いになっている。
  • Android端末からもPC用の日経電子版を読むことができる。有料会員としてログインもできる。とは言え,専用アプリが望まれる。
    • hootsuiteのAndroid版でtweets(@nikkeionline)経由で電子版の記事を読むと,非常によい感じに表示される。
  • 朝,電子版に出る「NY特急便は」,夕刊に載ることが多いけど(「ウォール街ラウンドアップ」),年末年始など夕刊がないときは電子版独自コンテンツになる。
  • 肩書きが「2011/1/1付」で,記事の末尾に「[日本経済新聞2011年1月1日付朝刊特集「跳べニッポン人」から再掲載]」とあるウェブコンテンツを同日夕方に見つけた。一見何の矛盾もないようだが,「朝刊・夕刊」の記事をウェブ版に出す際,いままで目にしてきた例では,末尾のような断りはない。肩書きの「2011/1/1付」からそれが分かるから。ここでは敢えて強調したか,普段とは担当が違ったのかもしれない。
  • ウェブ版(電子版)に出てくる(出てきた)一番古い記事はどの時期のものだろうか?「2003/12/4付」という記事を今日目にした。「MJ2003年ヒット商品番付」という記事。関連記事の一種として,過去のMJヒット商品番付の一つという形で出てきた。おそらく例外的だろう。
  • 「保存」しておいた記事が数日後,「該当する記事は表示できません。」という名前に変わっていたことがあった。撤回されたのだろうか。元どういう記事だったのか覚えていない。少なくとも5日間は表示さていたのだから,撤回は穏当でない。
  • 経済教室をワードロボ等で見ると,「経済教室」がどこにも入らないことは先に述べた。さらに大項目名・面名どころか,見出しすらなくなってしまう記事もある。社会面の「窓」は「My日経 > ワードロボ > 記事」の次の行にいきなり日付が来る。HTMLのタイトルには「窓」が入るが,ブラウザーの本文にはない。
  • 新型の《検索できない記事》を今日見つけた(2011年 1月15日)。偶発なのだろうが,何らかのバグの現れだろう。「まさか!?の千客万来 ふるさと再発見」という夕刊1面の短期連載。その第4回目(Ernst Seiler・和子夫妻を取り上げた「優しい和音 里山に共鳴」)だけは現時点で記事検索に出てこないし,「朝刊・夕刊」上の挙動も他の回と異なる。「保存」ボタンがない。記者(社内執筆者)が書いたにもかかわらず。否,社外執筆者の書いた記事でも「保存」はできる(ただし先述のように,実際には本文を読めないことがある。)のでかなり異例だ。
  • 2011/4/4付日本経済新聞 朝刊2面の「朝刊・夕刊」に「メガ>フロート」という記述があった。ゴミが入っている(2011/4/4 AM 9:16現在)。紙面にはない。
  • 電子版のコンテンツに,「これはダミーです。これはダミーです。」という謎のキャプションが付いた女性の写真が入ることがある。内容とは全く関係ない。しかも同じ写真が複数。23歳くらいの綺麗な女性で,モデルのようだが,僕は知らない。

このページのPDF Edit

このページをタイムスタンプ付きPDFにしたものを掲示しておきます。その時点でのこのページの内容を,電子的に証明する仕組みです。ウェブページのコンテンツが他人に剽窃された際,どこにオリジナルが存在したか裁判で証明する上で決定的かつ明快な証拠となります。

  • このページの字数は2010/12/9 AM 11:51時点で26,150字。改行,内部タグ含まず。正味TEXT。
  • このページの字数は2010/12/16 PM 2:15時点で33,373字。同。
  • このページの字数は2010/12/25 PM 5:09時点で41,347字。同。

関連情報 Edit


*1 逆に,紙面に限定して検索,等はできないので,同じ記事が2つずつ出てきてイライラする。
*2 応答速度はネット経路でも大きく変わるし,意外とブラウザーの差が大きい。
*3 なお,内部留保の金利(資本コスト)の方が借入金のそれより高い。コーポレートファイナンスの基礎である。
*4 クッキーではないようだ。
*5 ご免なさい。当ページのURLも不気味に長いです。冒頭記載の短縮URL・直通URLをお使い下さい。
*6 実際はアルファベットの検索漏れも無視できない水準だと思う。Googleのtweet検索(「アップデート」)で少し実験してみれば分かる。
*7 see NET/www
*8 「しかも」と書きたいのをぼかした。本当は,二重に馬鹿ということである。
*9 エディターの頭の中にあるそれ
*10 シンポジウム「デジタル時代の文字・活字文化」2010/12/27付日本経済新聞 朝刊
*11 偶々文章のずれを突いた稀少な場合を除き。
*12 実際はこの場合は画像のままか表が削除される。
*13 そもそも「日本経済新聞朝刊連動」という呼称は他人行儀である。
*14 学生のような暇人ではない
*15 少なくとも私がこれまで作ってきたソフトはそうなっている。

添付ファイル: file20101227-101055_over.6pb.info.pdf 118件 [詳細] file20101211-052153_over.6pb.info.pdf 113件 [詳細] file20101128-113242_over.6pb.info.pdf 301件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2011-06-26 (日) 11:41:16 (2218d)