Changeset 1306

Show
Ignore:
Timestamp:
07/22/2010 06:04:32 PM (19 months ago)
Author:
gbooker
Message:

Updated scrapers to correctly get year and ratings.

Files:
1 modified

Legend:

Unmodified
Added
Removed
  • trunk/SapphireFrappliance/MetaDataImporting/Scrapers/imdb.xml

    r1276 r1306  
    8080                        </RegExp> 
    8181                        <RegExp input="$$1" output="&lt;year&gt;\1&lt;/year&gt;" dest="5+"> 
    82                                 <expression>a href=&quot;/Sections/Years/([0-9]*)</expression> 
     82                                <expression>a href=&quot;/year/([0-9]*)</expression> 
    8383                        </RegExp> 
    8484                        <RegExp input="$$1" output="&lt;top250&gt;\1&lt;/top250&gt;" dest="5+"> 
     
    8686                        </RegExp> 
    8787                        <RegExp input="$$1" output="&lt;mpaa&gt;\1&lt;/mpaa&gt;" dest="5+"> 
    88                                 <expression>MPAA&lt;/a&gt;:&lt;/h5&gt;\n&lt;div class=&quot;info-content&quot;&gt;\n(.[^&lt;]*)</expression> 
     88                                <expression>MPAA&lt;/a&gt;:&lt;/h5&gt;&lt;div class=&quot;info-content&quot;&gt;(.[^&lt;]*)</expression> 
    8989                        </RegExp> 
    9090                        <RegExp input="$$1" output="&lt;certification&gt;\1 \3&lt;/certification&gt;" dest="5+"> 
    91                                 <expression repeat="yes">&lt;a href=&quot;/List\?certificates=[^&quot;]*&quot;&gt;([^&lt;]*)&lt;/a&gt;[^&lt;]*(&lt;i&gt;([^&lt;]*)&lt;/i&gt;)?</expression> 
     91                                <expression repeat="yes">&lt;a href=&quot;[^?]*\?certificates=[^&quot;]*&quot;&gt;([^&lt;]*)&lt;/a&gt;[^&lt;]*(&lt;i&gt;([^&lt;]*)&lt;/i&gt;)?</expression> 
    9292                        </RegExp> 
    9393                        <RegExp input="$$1" output="&lt;tagline&gt;\1&lt;/tagline&gt;" dest="5+">