root/trunk/SapphireFrappliance/MetaDataImporting/Scrapers/tvrage.xml

Revision 1358, 7.4 KB (checked in by gbooker, 4 months ago)

Updated scrapers
Fixes #401

Line 
1<?xml version="1.0" encoding="UTF-8"?>
2<scraper framework="1.0" date="2012-01-19" name="TV Rage" content="tvshows" thumb="tvrage.jpg" language="en">
3        <NfoUrl dest="3">
4                <RegExp input="$$1" output="&lt;url&gt;http://www.tvrage.com/\1&lt;/url&gt;&lt;id&gt;\2&lt;/id&gt;"  dest="3">
5                        <expression clear="yes" noclean="1">tvrage.com/(series/id-([0-9]*))</expression>
6                </RegExp>
7                <RegExp input="$$1" output="&lt;url&gt;http://www.tvrage.com/\1&lt;/url&gt;"  dest="3+">
8                        <expression clear="yes" noclean="1">tvrage.com/([^/ ]*?)(?!/id-[0-9])[/\s]</expression>
9                </RegExp>
10        </NfoUrl>
11        <CreateSearchUrl dest="3">
12                <RegExp input="$$1" output="&lt;url&gt;http://services.tvrage.com/feeds/search.php?show=\1&lt;/url&gt;" dest="3">
13                        <expression/>   
14                </RegExp>
15        </CreateSearchUrl>
16        <GetSearchResults dest="3">
17                <RegExp input="$$4" output="&lt;results&gt;\1&lt;/results&gt;" dest="3">       
18                        <RegExp input="$$1" output="&lt;entity&gt;&lt;title&gt;\2&lt;/title&gt;&lt;url&gt;\3&lt;/url&gt;&lt;id&gt;\1&lt;/id&gt;&lt;/entity&gt;" dest="4">
19                                <expression repeat="yes">&lt;showid&gt;([^&gt;]*)&lt;/showid&gt;.*?&lt;name&gt;([^&lt;]*)&lt;/name&gt;.*?&lt;link&gt;([^&lt;]*)&lt;/link&gt;</expression>       
20                        </RegExp>
21                        <expression noclean="1"/>
22                </RegExp>               
23        </GetSearchResults>
24        <GetDetails dest="7">
25                <RegExp input="$$5" output="&lt;details&gt;\1&lt;/details&gt;" dest="7">
26                        <RegExp input="$$1" output="&lt;title&gt;\1&lt;/title&gt;" dest="5">
27                                <expression>&lt;h1 class=&quot;content_title hover_blue&quot;&gt;&lt;a [^&gt;]*&gt;(.*?)&lt;/a&gt;</expression>
28                        </RegExp>
29                        <RegExp input="$$2" output="&lt;id&gt;\1&lt;/id&gt;" dest="5+">
30                                <RegExp input="$$1" output="\1" dest="2">
31                                        <expression>/edit/shows/([0-9]*)/</expression>
32                                </RegExp>
33                                <expression/>
34                        </RegExp>
35                        <RegExp input="$$1" output="&lt;plot&gt;\1&lt;/plot&gt;" dest="5+">                             
36                                <expression>&lt;div class=&quot;show_synopsis&quot;&gt;\s*(.*?)\s*&lt;/div&gt;</expression>
37                        </RegExp>                                               
38                        <RegExp input="$$1" output="&lt;rating&gt;\1&lt;/rating&gt;&lt;votes&gt;\2&lt;/votes&gt;" dest="5+">
39                                <expression>&lt;strong&gt;([0-9.]+)/10 \(([0-9]*) Votes cast\)&lt;/td&gt;</expression>
40                        </RegExp>
41                        <RegExp input="$$1" output="&lt;actor&gt;&lt;name&gt;\1&lt;/name&gt;&lt;role&gt;\2&lt;/role&gt;&lt;/actor&gt;"  dest="5+">
42                                <expression repeat="yes">a href=&apos;(?:http://www.tvrage.com)?/person/[^&gt;]*&gt;(.*?)&lt;/a&gt;.*?As&lt;i&gt;\s*(.*?)&lt;/i&gt;</expression>
43                        </RegExp>
44                        <RegExp input="$$1" output="&lt;thumb&gt;\1&lt;/thumb&gt;" dest="5+">
45                                <expression>(http://images\.tvrage\.com/shows/[0-9/]+\.(gif|jpg|png))</expression>
46                        </RegExp>       
47                        <RegExp input="$$1" output="&lt;status&gt;\1&lt;/status&gt;" dest="5+">
48                                <expression trim="1">Status\s*&lt;/b&gt;:\s*([^&gt;]*)&lt;br</expression>
49                        </RegExp>                                                       
50                        <RegExp input="$$1" output="&lt;premiered&gt;\1&lt;/premiered&gt;" dest="5+">
51                                <expression trim="1">Premiere\s*&lt;/b&gt;:\s*([^&lt;]*)&lt;br&gt;</expression>
52                        </RegExp>
53                        <RegExp input="$$1" output="&lt;runtime&gt;\1&lt;/runtime&gt;" dest="5+">
54                                <expression trim="1">Runtime\s*&lt;/b&gt;:\s*([^&lt;]*)&lt;br&gt;</expression>
55                        </RegExp>       
56                        <RegExp input="$$6" output="&lt;genre&gt;\1&lt;/genre&gt;" dest="5+">                   
57                                <RegExp input="$$1" output="| \1" dest="6">
58                                        <expression noclean="1">Genre\s*&lt;/b&gt;:\s*([^&lt;]*)&lt;br&gt;</expression>
59                                </RegExp>               
60                                <expression repeat="yes">\| ([^\|]*)</expression>
61                        </RegExp>
62                        <RegExp output="&lt;episodeguide&gt;&lt;url&gt;http://services.tvrage.com/feeds/episode_list.php?sid=$$2&lt;/url&gt;&lt;/episodeguide&gt;" dest="5+">
63                                <expression />
64                        </RegExp>                                                                                                                               
65                        <expression noclean="1"/>
66                </RegExp>
67        </GetDetails>           
68        <GetEpisodeList dest="3">
69                <RegExp input="$$5" output="&lt;episodeguide&gt;\1&lt;/episodeguide&gt;" dest="3">
70                        <RegExp input="$$1" output="&lt;episode&gt;&lt;url&gt;\4&lt;/url&gt;&lt;title&gt;\6&lt;/title&gt;&lt;epnum&gt;\3&lt;/epnum&gt;&lt;season&gt;\$1&lt;/season&gt;&lt;absoluteEp&gt;\2&lt;/absoluteEp&gt;&lt;id&gt;\5&lt;/id&gt;&lt;/episode&gt;" dest="5+">
71                                <expression repeat="yes">(?:&lt;Season no=&quot;([0-9]*)&quot;&gt;.*?)?&lt;epnum&gt;([^&lt;]*)&lt;/epnum&gt;.*?&lt;seasonnum&gt;([^&lt;]*)&lt;/seasonnum&gt;.*?&lt;link&gt;([^&lt;]*/([0-9]*))&lt;/link&gt;&lt;title&gt;([^&lt;]*)&lt;/title&gt;</expression>
72                        </RegExp>       
73                        <RegExp input="$$1" output="&lt;episode&gt;&lt;url&gt;\2&lt;/url&gt;&lt;season&gt;\1&lt;/season&gt;&lt;title&gt;\4&lt;/title&gt;&lt;id&gt;\3&lt;/id&gt;&lt;/episode&gt;" dest="5+">
74                                <expression repeat="yes">&lt;season&gt;([^&lt;]*)&lt;/season&gt;.*?&lt;link&gt;([^&lt;]*/([0-9]*))&lt;/link&gt;&lt;title&gt;([^&lt;]*)&lt;/title&gt;</expression>
75                        </RegExp>
76                        <expression noclean="1"/>                       
77                </RegExp>                               
78        </GetEpisodeList>               
79        <GetEpisodeDetails dest="3">
80                <RegExp input="$$5" output="&lt;details&gt;\1&lt;/details&gt;" dest="3">       
81                        <RegExp input="$$1" output="&lt;title&gt;\1&lt;/title&gt;" dest="5">
82                                <expression>&lt;h1 class=&apos;content_title hover_blue&apos;&gt;\s*&lt;a [^&gt;]*&gt;[^&lt;]*&lt;/a&gt;:\s*([^&lt;]*)&lt;/h1&gt;</expression>
83                        </RegExp>
84                        <RegExp input="$$1" output="&lt;plot&gt;\1&lt;/plot&gt;" dest="5+">
85                                <expression>&lt;div class=&apos;show_synopsis&apos;&gt;\s*(.*?)&lt;br&gt;\s*&lt;br&gt;&lt;span class=&apos;left&apos;&gt;.*?\s*&lt;/div&gt;</expression>
86                        </RegExp>
87                        <RegExp input="$$1" output="&lt;plot&gt;\1&lt;/plot&gt;" dest="5+">
88                                <expression>&lt;/div&gt;&lt;div&gt;(?:&lt;a href=&apos;/edit/shows/.*&lt;/a&gt;)?(.*?)&lt;br&gt;\s*&lt;br&gt;&lt;span class=&apos;left&apos;.*?&lt;/div&gt;</expression>
89                        </RegExp>
90                        <RegExp input="$$1" output="&lt;rating&gt;\1&lt;/rating&gt;&lt;votes&gt;\2&lt;/votes&gt;" dest="5+">
91                                <expression>&lt;strong&gt;([0-9.]+)/10 \(([0-9]*) Votes? cast\)&lt;/td&gt;</expression>
92                        </RegExp>
93                        <RegExp input="$$1" output="&lt;aired&gt;\1&lt;/aired&gt;" dest="5+">
94                                <expression>(?:Original )?Airdate:\s*&lt;/b&gt;\s*([^&lt;]*)&lt;br</expression>
95                        </RegExp>
96                        <RegExp input="$$1" output="&lt;thumb&gt;\1&lt;/thumb&gt;" dest="5+">
97                                <expression>(http://images\.tvrage\.com/screencaps/[0-9/]*\.(jpg|gif|png))</expression>
98                        </RegExp>                               
99                        <RegExp input="$$1" output="&lt;code&gt;\1&lt;/code&gt;" dest="5+">
100                                <expression>Production Number:\s*&lt;/b&gt;\s*([^&lt;]*)&lt;br</expression>
101                        </RegExp>                                                       
102                        <RegExp input="$$1" output="&lt;actor&gt;&lt;name&gt;\1&lt;/name&gt;&lt;role&gt;\2&lt;/role&gt;&lt;/actor&gt;"  dest="5+">
103                                <expression repeat="yes">&gt;a href=&apos;(?:http://www.tvrage.com)?/person/[^&gt;]*&gt;([^&lt;]*)&lt;/a&gt;&lt;/b&gt;&lt;br /&gt;\s*As&lt;i&gt;\s*([^&lt;]*)&lt;/i&gt;</expression>
104                        </RegExp>
105                        <RegExp input="$$2" output="&lt;director&gt;\1&lt;/director&gt;" dest="5+">                     
106                                <RegExp input="$$1" output="| \1" dest="2">
107                                        <expression noclean="1">Director: &lt;/b&gt;&lt;/td&gt;&lt;td[^&gt;]*&gt;&lt;i&gt;&lt;a href=&apos;(?:http://www.tvrage.com)?/person/[^&gt;]*&gt;([^(&lt;|\(|/)]*)&lt;/a&gt;&lt;/i&gt;</expression>
108                                </RegExp>               
109                                <expression repeat="yes">\| ([^\|]*)</expression>
110                        </RegExp>
111                        <RegExp input="$$2" output="&lt;credits&gt;\1&lt;/credits&gt;" dest="5+">                       
112                                <RegExp input="$$1" output="| \1" dest="2">
113                                        <expression noclean="1">Writer: &lt;/b&gt;&lt;/td&gt;&lt;td[^&gt;]*&gt;&lt;i&gt;&lt;a href=&apos;(?:http://www.tvrage.com)?/person/[^&gt;]*&gt;([^(&lt;|\(|/)]*)&lt;/a&gt;&lt;/i&gt;</expression>
114                                </RegExp>               
115                                <expression repeat="yes">\| ([^\|]*)</expression>
116                        </RegExp>
117                        <expression noclean="1"/>       
118                </RegExp>
119        </GetEpisodeDetails>                   
120</scraper>
Note: See TracBrowser for help on using the browser.