Changeset 1335

Show
Ignore:
Timestamp:
04/15/11 22:58:23 (13 months ago)
Author:
gbooker
Message:

Corrections for new tvrage format

Files:
1 modified

Legend:

Unmodified
Added
Removed
  • trunk/SapphireFrappliance/MetaDataImporting/Scrapers/tvrage.xml

    r1312 r1335  
    2525                <RegExp input="$$5" output="&lt;details&gt;\1&lt;/details&gt;" dest="7"> 
    2626                        <RegExp input="$$1" output="&lt;title&gt;\1&lt;/title&gt;" dest="5"> 
    27                                 <expression>&lt;a name=&apos;summary&apos;&gt;.*?&lt;/a&gt;(.*?) (Summary|Online)&lt;/strong&gt;</expression> 
     27                                <expression>&lt;h1 class=&quot;content_title hover_blue&quot;&gt;&lt;a [^&gt;]*&gt;(.*?)&lt;/a&gt;</expression> 
    2828                        </RegExp> 
    2929                        <RegExp input="$$2" output="&lt;id&gt;\1&lt;/id&gt;" dest="5+"> 
    3030                                <RegExp input="$$1" output="\1" dest="2"> 
    31                                         <expression>/shows/([0-9]*)/</expression> 
     31                                        <expression>/edit/shows/([0-9]*)/</expression> 
    3232                                </RegExp> 
    3333                                <expression/> 
    3434                        </RegExp> 
    3535                        <RegExp input="$$1" output="&lt;plot&gt;\1&lt;/plot&gt;" dest="5+">                              
    36                                 <expression>&lt;/table&gt;&lt;table.*?&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;(?:&lt;div [^&gt;]*id=&apos;sft_1&apos;&gt;)?(.*?)(?:\n&lt;br&gt;\n&lt;a onclick=.*?|\n)&lt;br&gt;\n?&amp;nbsp;?&lt;/td&gt;&lt;/tr&gt;</expression> 
     36                                <expression>&lt;div class=&quot;show_synopsis&quot;&gt;\s*(.*?)\s*&lt;/div&gt;</expression> 
    3737                        </RegExp>                                                
    3838                        <RegExp input="$$1" output="&lt;rating&gt;\1&lt;/rating&gt;&lt;votes&gt;\2&lt;/votes&gt;" dest="5+"> 
     
    4040                        </RegExp> 
    4141                        <RegExp input="$$1" output="&lt;actor&gt;&lt;name&gt;\1&lt;/name&gt;&lt;role&gt;\2&lt;/role&gt;&lt;/actor&gt;"  dest="5+"> 
    42                                 <expression repeat="yes">a href='/person/[^&gt;]*&gt;([^(&lt;|\(|/)]*)(?: [0-9()]*)?&lt;/a&gt;&lt;/i&gt;&lt;/span&gt;&lt;/td&gt;&lt;td[^&gt;]*&gt;&lt;b&gt;played&lt;/b&gt;&lt;/td&gt;&lt;td[^&gt;]*&gt;&lt;div[^&gt;]*&gt;&lt;i&gt;([^(&lt;|\(|/)]*)</expression> 
     42                                <expression repeat="yes">a href=&apos;(?:http://www.tvrage.com)?/person/[^&gt;]*&gt;(.*?)&lt;/a&gt;.*?As&lt;i&gt;\s*(.*?)&lt;/i&gt;</expression> 
    4343                        </RegExp> 
    4444                        <RegExp input="$$1" output="&lt;thumb&gt;\1&lt;/thumb&gt;" dest="5+"> 
     
    4646                        </RegExp>        
    4747                        <RegExp input="$$1" output="&lt;status&gt;\1&lt;/status&gt;" dest="5+"> 
    48                                 <expression trim="1">Status: &lt;/b&gt;&lt;/td&gt;&lt;td&gt;([^&lt;]*)&lt;/td&gt;</expression> 
     48                                <expression trim="1">Status\s*&lt;/b&gt;:\s*([^&gt;]*)&lt;br</expression> 
    4949                        </RegExp>                                                         
    5050                        <RegExp input="$$1" output="&lt;premiered&gt;\1&lt;/premiered&gt;" dest="5+"> 
    51                                 <expression trim="1">Premiere: &lt;/b&gt;&lt;/td&gt;&lt;td&gt;([^&lt;]*)&lt;/td&gt;</expression> 
     51                                <expression trim="1">Premiere\s*&lt;/b&gt;:\s*([^&lt;]*)&lt;br&gt;</expression> 
    5252                        </RegExp> 
    5353                        <RegExp input="$$1" output="&lt;runtime&gt;\1&lt;/runtime&gt;" dest="5+"> 
    54                                 <expression trim="1">Runtime: &lt;/b&gt;&lt;/td&gt;&lt;td&gt;([^&lt;]*)&lt;/td&gt;</expression> 
     54                                <expression trim="1">Runtime\s*&lt;/b&gt;:\s*([^&lt;]*)&lt;br&gt;</expression> 
    5555                        </RegExp>        
    5656                        <RegExp input="$$6" output="&lt;genre&gt;\1&lt;/genre&gt;" dest="5+">                    
    5757                                <RegExp input="$$1" output="| \1" dest="6"> 
    58                                         <expression noclean="1">Genre: &lt;/b&gt;&lt;/td&gt;&lt;td&gt;([^&lt;]*)&lt;/td&gt;</expression> 
     58                                        <expression noclean="1">Genre\s*&lt;/b&gt;:\s*([^&lt;]*)&lt;br&gt;</expression> 
    5959                                </RegExp>                
    6060                                <expression repeat="yes">\| ([^\|]*)</expression> 
     
    8080                <RegExp input="$$5" output="&lt;details&gt;\1&lt;/details&gt;" dest="3">         
    8181                        <RegExp input="$$1" output="&lt;title&gt;\1&lt;/title&gt;" dest="5"> 
    82                                 <expression>Title: &lt;/b&gt;&lt;/td&gt;&lt;td class='b2'[^&gt;]*&gt;([^&lt;]*)&lt;/td&gt;</expression> 
     82                                <expression>&lt;h1 class=&apos;content_title hover_blue&apos;&gt;([^&gt;]*)&lt;/h1&gt;</expression> 
    8383                        </RegExp>        
    8484                        <RegExp input="$$1" output="&lt;plot&gt;\1&lt;/plot&gt;" dest="5+"> 
    85                                 <expression>&lt;td&gt;&lt;table width=&apos;100%&apos;&gt;&lt;tr&gt;&lt;td valign=&apos;top&apos;&gt;&lt;table width=&apos;100%&apos;&gt;&lt;tr&gt;&lt;td&gt;.*?&lt;/script&gt;&lt;br&gt;(.*?)&lt;br&gt;&amp;nbsp;&lt;/td&gt;&lt;/tr&gt;&lt;tr&gt;</expression> 
     85                                <expression>&lt;div class=&apos;show_synopsis&apos;&gt;(.*?)&lt;/div&gt;</expression> 
    8686                        </RegExp> 
    8787                        <RegExp input="$$1" output="&lt;rating&gt;\1&lt;/rating&gt;&lt;votes&gt;\2&lt;/votes&gt;" dest="5+"> 
    88                                 <expression>&lt;strong&gt;([0-9.]+)/10 \(([0-9]*) Votes cast\)&lt;/td&gt;</expression> 
     88                                <expression>&lt;strong&gt;([0-9.]+)/10 \(([0-9]*) Votes? cast\)&lt;/td&gt;</expression> 
    8989                        </RegExp> 
    9090                        <RegExp input="$$1" output="&lt;aired&gt;\1&lt;/aired&gt;" dest="5+"> 
    91                                 <expression>Original Airdate: &lt;/b&gt;&lt;/td&gt;&lt;td class='b2'[^&gt;]*&gt;([^&lt;]*)</expression> 
     91                                <expression>(?:Original )?Airdate:\s*&lt;/b&gt;\s*([^&lt;]*)&lt;br</expression> 
    9292                        </RegExp> 
    9393                        <RegExp input="$$1" output="&lt;thumb&gt;\1&lt;/thumb&gt;" dest="5+"> 
     
    9595                        </RegExp>                                
    9696                        <RegExp input="$$1" output="&lt;code&gt;\1&lt;/code&gt;" dest="5+"> 
    97                                 <expression>Production Number: &lt;/b&gt;&lt;/td&gt;&lt;td class='b2'[^&gt;]*&gt;([^&lt;]*)&lt;/td&gt;</expression> 
     97                                <expression>Production Number:\s*&lt;/b&gt;\s*([^&lt;]*)&lt;br</expression> 
    9898                        </RegExp>                                                        
    9999                        <RegExp input="$$1" output="&lt;actor&gt;&lt;name&gt;\1&lt;/name&gt;&lt;role&gt;\2&lt;/role&gt;&lt;/actor&gt;"  dest="5+"> 
    100                                 <expression repeat="yes">a href=&#x27;/person/[^&gt;]*&gt;([^(&lt;|\(|/)]*).*?&lt;/a&gt;&lt;/i&gt;&lt;/td&gt;&lt;td[^&gt;]*&gt;&lt;b&gt;(?:played|voiced)&lt;/b&gt;&lt;/td&gt;&lt;td&gt;&lt;i&gt;([^(&lt;|\(|/)]*)</expression> 
     100                                <expression repeat="yes">a href=&apos;(?:http://www.tvrage.com)?/person/[^&gt;]*&gt;(.*?)&lt;/a&gt;.*?As&lt;i&gt;\s*(.*?)&lt;/i&gt;</expression> 
    101101                        </RegExp> 
    102102                        <RegExp input="$$2" output="&lt;director&gt;\1&lt;/director&gt;" dest="5+">                      
    103103                                <RegExp input="$$1" output="| \1" dest="2"> 
    104                                         <expression noclean="1">Director: &lt;/b&gt;&lt;/td&gt;&lt;td[^&gt;]*&gt;&lt;i&gt;&lt;a href='/person/[^&gt;]*&gt;([^(&lt;|\(|/)]*)&lt;/a&gt;&lt;/i&gt;</expression> 
     104                                        <expression noclean="1">Director: &lt;/b&gt;&lt;/td&gt;&lt;td[^&gt;]*&gt;&lt;i&gt;&lt;a href=&apos;(?:http://www.tvrage.com)?/person/[^&gt;]*&gt;([^(&lt;|\(|/)]*)&lt;/a&gt;&lt;/i&gt;</expression> 
    105105                                </RegExp>                
    106106                                <expression repeat="yes">\| ([^\|]*)</expression> 
     
    108108                        <RegExp input="$$2" output="&lt;credits&gt;\1&lt;/credits&gt;" dest="5+">                        
    109109                                <RegExp input="$$1" output="| \1" dest="2"> 
    110                                         <expression noclean="1">Writer: &lt;/b&gt;&lt;/td&gt;&lt;td[^&gt;]*&gt;&lt;i&gt;&lt;a href='/person/[^&gt;]*&gt;([^(&lt;|\(|/)]*)&lt;/a&gt;&lt;/i&gt;</expression> 
     110                                        <expression noclean="1">Writer: &lt;/b&gt;&lt;/td&gt;&lt;td[^&gt;]*&gt;&lt;i&gt;&lt;a href=&apos;(?:http://www.tvrage.com)?/person/[^&gt;]*&gt;([^(&lt;|\(|/)]*)&lt;/a&gt;&lt;/i&gt;</expression> 
    111111                                </RegExp>                
    112112                                <expression repeat="yes">\| ([^\|]*)</expression>