NET/www/webプログラミング
の編集
https://over.6pb.info/wiki/?&8694a1ee7e
[
トップ
] [
編集
|
差分
|
履歴
|
添付
|
リロード
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
]
-- 雛形とするページ --
(no template pages)
*Puppeteer [#puppeteer] -[[Amexの明細(速報)の自動取得>生活/クレジットカード/為替手数料#amex]] -パズル認証や2段階認証は、正面から突破するより、1回は手動で補助してログインし、cookieをやりとりすれば、たいていはしばらく追加認証を回避できる。(毎回、追加認証を課すサイトには通用しない。)cookieはPuppeteerのコードで明示的に取得・保存する必要がある。headlessブラウザに(自動的に)保存されるものは助けにならないようだ。(サイトによって違うかも。) --(毎回の)パズル認証を(簡単に)回避できたサイト: ---三井住友カード -headlessだとうまく巡回できない(headlessを無効にすれば順調な)サイトもある。例えば、三井住友カードはheadlessだといまのところ巡回に成功していない。headlessで動かないと、VPSのCentOSで動かすのが面倒だ(普通、クラウドのCentOSにX Windowは入れない。)。cronで定期的に実行するには、VPSが望ましい。次善の策として、新たに、自宅サーバーにGNOME Desktop付きのCentOS 7を入れた。(CentOS 6ではheadless Chromeは動かないようだ。)これでいまのところ三井住友カードも自動巡回できている。 -cronで動かすならtry-catchを書かないと、時間切れなど何か予期せぬことが起きる度にメモリに貯まっていく。自動終了しない。 -[[Webサイトのクローリングやスクリーンショット撮影が簡単にできるヘッドレスChromeがGCPに登場 - GIGAZINE:https://gigazine.net/news/20180818-gcp-node-puppeteer-headless-chrome/]]
タイムスタンプを変更しない
___paraedit_taxtarea___
テキスト整形のルールを表示する