Erogeek Conference #1 でも発表した、日本のある程度有名なAV女優一覧を取得するPerlモジュール 「Acme::JapaneseAvActress」をCodeReposにアップしました。 合計で2600名のAV女優が今のところリストアップされます。
一人のAV女優には
- name(漢字を含む名)
- yomi(読みふりがな)
- initial(頭文字ふりがな)
- year(デビューの年西暦)
というプロパティを持っています。 仕組みとしては、 Wikipediaの日本のAV女優一覧というページのExportというXMLを出力するサービスから、 正規表現でごりごりスクレイピングしています。 Web::Scraperは使ってません。
使用例として、例えば、2007年にデビューしたAV女優をData::Dumperでダンプするには
use Acme::JapaneseAvActress; use Data::Dumper; my $actress = Acme::JapaneseAvActress->new( { 'cache_root' => '/tmp/avactress', 'default_expires' => '7days', } ); $actress->get; my $actlist = $actress->year("2007"); print Dumper($actlist);
出力結果は
$VAR1 = [ bless( { 'name' => 'あいかわゆら', 'yomi' => '', 'initial' => 'あ', 'year' => '2007' }, 'Acme::JapaneseAvActress::Actress' ), bless( { 'name' => '愛澤こころ', 'yomi' => 'あいざわ こころ', 'initial' => 'あ', 'year' => '2007' }, 'Acme::JapaneseAvActress::Actress' ), bless( { 'name' => '合沢萌', 'yomi' => 'あいざわ もえ', 'initial' => 'あ', 'year' => '2007' }, 'Acme::JapaneseAvActress::Actress' ), bless( { 'name' => '相沢桃', 'yomi' => 'あいざわ もも', 'initial' => 'あ', 'year' => '2007' }, 'Acme::JapaneseAvActress::Actress' ), bless( { 'name' => '愛嶋リーナ', 'yomi' => 'あいしま りーな', 'initial' => 'あ', 'year' => '2007' }, 'Acme::JapaneseAvActress::Actress' ), …
こんな具合です。$actress->year("名前"); なんてやると、その名前がAV女優かどうかチェックできたりします。 また、Cache::FileでWikipediaのExportページをキャッシュする機能もついています。 CodeReposの以下においておくのでよっぽど物好きの人は使ってください。あ、そうそうCPANにAcme::Playmateというのがあるので、 そのうちこれでCPAN Authorになっちゃうかも!