2009年4月29日 星期三

如何用Perl分析運彩? 系列之一 自動抓MLB資料

每天的daily update,小弟都是從抓官網上的scoreboard開始。為什麼呢?因為計分板的網頁單純,路徑簡單,上面有完整的各賽事的結果、box連結,更可以直接跳到隔天去看預測的先發投手(與運彩的比對)。
以前我不知道perl可以抓網頁,我是透過迅雷那種抓檔軟體去批次抓。後來才發現抓取網頁,perl需要使用到的程式就像下面這麼簡單,基本上就是靠內建的LWP模組罷了。由於未來要抓取的網頁太多種,所以建議把這段寫成function,這就看個人習慣了。至於當天日期怎麼來,方法很多,我是用localtime()來完成。範例請靠google,以後沒有講的部分就是很容易在google找到的那種。

我發現程式碼直接貼上來會亂掉,可是這個blogger提供的編寫工作我還不會排版。
---------
use LWP::Simple;

#$current_date = "20090429";

$url =
'http://mlb.mlb.com/mlb/scoreboard/' . "$current_date" . '.html';

$file = "$current_date" . "_scoreboard.html";

if(-e $file){ print "$file already exist!!\n"; return $file; }
else{ getstore($url, $file); }
------------

沒有留言:

 
運動彩券部落格聯播