他人のページに勝手に「このテーブルをダウンロード」ボタンを付けて、ダウンロードできるようにする工夫。Greasemonkey (Tampermonkey)を初めて知ったときは、「なるほど。こんなことができるんだ」と大いに感激したものだ。以下のスクリプトを使うと、他人のページのテーブルの下部にダウンロードボタンが現れる。押すと、テーブルの内容がCSVファイルでダウンロードされる。
自分のページは自分だけが改変できるし、他人のページはその管理者だけが改変できる、というのは必ずしも正しくない。勝手にボタンを付けることは可能だ(他にもいろいろできる)。ハッキング(不正侵入)とは違う。相手方がこちらのブラウザーに送り届けた画面情報を、こちらのブラウザーの側で変更しているだけだ。相手のサーバー上にあるデータを変更しているわけではないし、相手のサーバーに特別なデータを出させているわけでもない。通常は、相手は、こちらが改変していることを感知できない。(ただし、相手の著作権や商標権の侵害にはなり得るので、改変した画面の二次利用には注意。)
ネットに同等品は幾つかあるが、JCBのサイトでworkしなかったので作った。jQueryを使用。jQueryはGreasemonkey/Tampermonkeyで動く動かないという話があるようだが、少なくとも現時点では最新のChromeブラウザ(Windows)と最新のjQueryの組合せで特に問題ないようだ。2018年 5月
次のライブラリを使用。GitHub - OmbraDiFenice/table2csv: A simple jQuery plugin to convert HTML tables to CSV
// ==UserScript== // @name <table> to csv // @namespace https://over.6pb.info/ // @include https://club.dccard.co.jp/* // @include https://my.jcb.co.jp/iss-pc/member/* // @require https://over.6pb.info/lib/jquery.min.js // @require https://over.6pb.info/lib/table2csv.js // @grant none // ==/UserScript== (function() { $('table').each(function() { var $table = $(this); var $button = $("<button type='button'>"); $button.text("Exp"); $button.insertAfter($table); $button.click(function() { $table.table2csv(); //単にダウンロードするならこれだけ }); }); })();
仕事でJavaScriptを始めた人を除き、何がJavaScriptを使うきっかけになるのだろうか。私はChromeブラウザとJavaScriptを使うと、画面上に書いてある情報を抜き出すのが楽になる(手作業で一つ一つコピペしなくて済む)ことだった。
例えば、外国為替情報 : 三井住友銀行のページから、「今月」のPDF(毎日アップされる)の、URL一覧を取得したいとする。(2018年5月現在。将来、先方の仕様が変更されたら動かない。)
現在表示しているページについて何か調べたい・操作したいときは、ChromeブラウザのDeveloper Toolsを開き(F12キーを押す)、Consoleタブにスクリプトを記入・実行する。スクリプトは、一行ずつConsoleに書くのではなく、メモ帳に書いてから、全部の行の分をまとめてConsoleにペーストする。
var elms = document.querySelectorAll('#tabbox1 div li a'); for (var i=0; i <elms.length; i++) { console.log(elms[i].href); }
var elms = document.evaluate('//*[@id="tabbox1"]/div//li/a', document, null, XPathResult.ORDERED_NODE_SNAPSHOT_TYPE, null ); for (var i=0; i <elms.snapshotLength; i++) { console.log(elms.snapshotItem(i).href); }
var elms = document.querySelectorAll('#tabbox1 div li a'); var w = window.open('about:blank'); w.document.open(); w.document.write('<textarea id="export" rows="40" cols="100">'); for (var i=0; i <elms.length; i++) { w.document.write(elms[i].href + "\n"); } w.document.write('</textarea>');
var elms = document.querySelectorAll('#tabbox1 div li a'); var text = ''; for (var i=0; i <elms.length; i++) { text += elms[i].href + "\n"; } var blob = new Blob([text], {type: "text/plain"}); var a = document.createElement("a"); a.href = URL.createObjectURL(blob); a.target = '_blank'; a.download = 'url.txt'; a.click();
手作業でやるより簡単で、間違いがない。
Google Sheets/Google スプレッドシートが便利だ。
データの取得は左側のように1次元のことが多いだろう。内容を把握するには右側のような2次元にするのが普通だ(クロス集計)。Google Sheetsを使うと簡単だ。「=B3」みたいに個々ベタに埋め込むとメンテが困難を極める。
F2 | =TRANSPOSE(UNIQUE(A2:A)) |
E2 | =UNIQUE(C2:C) |
F2 | =FILTER($B:$B,$E2=$C:$C,F$1=$A:$A) |
G2 | =FILTER($B:$B,$E2=$C:$C,G$1=$A:$A) |
F3 | =FILTER($B:$B,$E3=$C:$C,F$1=$A:$A) |
やり方は色々あるが,私がよく使うのはfilter関数。(Google Sheets/Google スプレッドシートのもの。Excelにはない。)軽くて,条件設定も柔軟。例えば,シート1の列Bと列D,列FからG,以上から(このように飛び飛びでもよい),列Aの値が4で,かつ列Cの値が"車"の行だけを取り出すなら
=filter({'シート1'!b:b,'シート1'!d:d,'シート1'!f:g},'シート1'!a:a=4,'シート1'!c:c="車")
UNIXのパイプのようにそのままsortやuniqueをかけられるのも重宝する。
vlookupだと、条件を一つしか付けられないが、filterなら幾つでも付けられる。これはExcelにはない大きな利点だ。
ただ、filterはarrayformulaと組みにできない不利もある。複数条件のvlookupをarrayformulaと組みにするため、複数条件のvlookupを1条件に書き直すアプローチもある。
例えば、求める値がC列、検索語と検索範囲のペアが、A列に対しD列、B列に対しE列(2条件)のとき、つまり
=filter(c:c,a2=d:d,b2=e:e)
のとき(行2の式)、A列とB列を連結して1列にし、同じくD列とE列も連結して1列にすることで、1条件に書き換えることができる。
A列とB列を連結して1列に | a2:a&b2:b | |
D列とE列を連結して1列に | d2:d&e2:e | |
検索語 | d2:d&e2:e | |
検索範囲 | {a2:a&b2:b,c2:c} | この2列目がC列 |
検索範囲を配列に変換 | arrayformula({a2:a&b2:b,c2:c}) |
=arrayformula(vlookup(d2:d&e2:e,arrayformula({a2:a&b2:b,c2:c}),2,false))
しかしかなり遅いようだ。
これもやり方は色々あるが,私が使うのはimportrangeとquery関数。これに対しimportrangeとfilter関数でも同じことができ、この方がとっつきやすいが、filter関数を使って別ファイルから取り込むには何回もimportrangeを書く必要があり、記述がごちゃごちゃする。(後日、変更があったとき、直すのに手間が増える。)
例えば、同じファイルのシートs1から{C5:C,F5:F,T5:U}の列を,N5:N>=5の行に限り,抜き出すなら:
=filter({'s1'!C5:C,'s1'!F5:F,'s1'!T5:U},'s1'!N5:N>=5)
これと同じことを別のファイルに対して行うには:
=query(importrange("https://docs.google.com/...","C5:U"),"select Col1, Col4, Col18, Col19 where Col12>=5")
親ファイルで作業シートを作り,それを別ファイルでimportしても同じことはできる。2段階で処理する。それならfilterだけで抽出できるので,query関数を新たに覚える必要がない。しかし200万セル制限があるので,作業シートを作る(特に親ファイルで)のはなるべく避けたい。
シートの最終行を知りたいとき、対象列がIMPORTRANGEで読み込んだ列の場合、getLastRow() はworkしないようだ。998になる。自力で地道に中身を検査する必要がある。
var col = 1; // 調べる列 var lastrow = 0; var cells = sheet.getDataRange().getValues(); // 実際のシートの大きさ(最終行)を調べる作業変数 for (var i = 0; i < cells.length; i++) { if (!cells[i][col-1].match(/\w/)) { //配列添字なのでcol-1 lastrow = i; // 現在のcells[i]は空行を指しているので、cells[i-1]が最終行になり、最終行の行番号はi。 break; //Perlのlastはbreak。continueはnext。 } }
「109.69」と「=(P707+Q707)/2」など、ベタに値を入れたセルと、計算式で値を作ったセルとが混在していると、queryで取り込んだとき、値が空になることがある。query関数は、列の型が数値か文字列かを自動判定しており、その際、どちらが多いかで判定するそうだ。列が数値と判定されると、文字列はblankに変換される。Cf. GoogleスプレッドシートのQuery関数で結果が空になる謎仕様と回避策。間にfilterがあっても、違いは引き継がれる模様。
=UNIQUE(A2:A) | =ARRAYFORMULA(countif(A1:A,B2:B14)) | |
EUR | EUR | 20 |
EUR | HKD | 32 |
EUR | MYR | 43 |
EUR | SGD | 15 |
EUR | TWD | 41 |
EUR | USD | 316 |
EUR | CAD | 2 |
EUR | CNY | 18 |
HKD | KRW | 7 |
HKD | GBP | 8 |
HKD | HRK | 7 |
MYR | THB | 1 |
MYR | TRY | 1 |
MYR | ||
SGD | ||
以下続 |
銘柄 コード エーザイ <4523.T> 小野薬品工業 <4528.OS> 東燃ゼネラル石油 <5012.T>
銘柄 エーザイ 小野薬品工業 東燃ゼネラル石油 コード <4523.T> <4528.OS> <5012.T>
銘柄 コード エーザイ <4523.T> 小野薬品工業 <4528.OS> 東燃ゼネラル石油 <5012.T>
1)エーザイ <4523.T> 5.11% 884,659 17 2)小野薬品工業 <4528.OS> 5.03% 434,449 11 3)東燃ゼネラル石油 <5012.T> 4.88% 448,755 5
1)エーザイ <4523.T> 5.11% 884,659 17 2)小野薬品工業 <4528.OS> 5.03% 434,449 11 3)東燃ゼネラル石油 <5012.T> 4.88% 448,755 5
Unicode code point | character | UTF-8 encoding (hex) | Unicode character name |
U+0100 | Ā | c4 80 | LATIN CAPITAL LETTER A WITH MACRON |
U+0101 | ā | c4 81 | LATIN SMALL LETTER A WITH MACRON |
U+0112 | Ē | c4 92 | LATIN CAPITAL LETTER E WITH MACRON |
U+0113 | ē | c4 93 | LATIN SMALL LETTER E WITH MACRON |
U+012A | Ī | c4 aa | LATIN CAPITAL LETTER I WITH MACRON |
U+012B | ī | c4 ab | LATIN SMALL LETTER I WITH MACRON |
U+014C | Ō | c5 8c | LATIN CAPITAL LETTER O WITH MACRON |
U+014D | ō | c5 8d | LATIN SMALL LETTER O WITH MACRON |
U+016A | Ū | c5 aa | LATIN CAPITAL LETTER U WITH MACRON |
U+016B | ū | c5 ab | LATIN SMALL LETTER U WITH MACRON |