doxygen/culrcscrapers_2darklyrics_2lyricsScraper_8py_source.html

#-*- coding: UTF-8 -*-

'''

Scraper for http://www.darklyrics.com/ - the largest metal lyrics archive on the Web.


scraper by smory

'''


import hashlib

import math

import requests

import time

import urllib.parse

import re

from lib.utils import *

try:

    from ctypes import c_int32 # ctypes not supported on xbox

except:

    pass


__title__ = 'darklyrics'

__priority__ = '260'

__lrc__ = False


class LyricsFetcher:

    def __init__(self, *args, **kwargs):

        self.DEBUG = kwargs['debug']

        self.settings = kwargs['settings']

        self.base_url = 'http://www.darklyrics.com/'

        self.searchUrl = 'http://www.darklyrics.com/search?q=%s'

        self.cookie = self.getCookie()


    def getCookie(self):

         # http://www.darklyrics.com/tban.js

         lastvisitts = 'Nergal' + str(math.ceil(time.time() * 1000 / (60 * 60 * 6 * 1000)))

         lastvisittscookie = 0

         i = 0

         while i < len(lastvisitts):

             try:

                 lastvisittscookie = c_int32((c_int32(lastvisittscookie<<5).value - c_int32(lastvisittscookie).value) + ord(lastvisitts[i])).value

             except:

                 return

             i += 1

         lastvisittscookie = lastvisittscookie & lastvisittscookie

         return str(lastvisittscookie)


    def search(self, artist, title):

        term = urllib.parse.quote((artist if artist else '') + '+' + (title if title else ''))

        try:

            headers = {'user-agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:78.0) Gecko/20100101 Firefox/78.0'}

            req = requests.get(self.searchUrl % term, headers=headers, cookies={'lastvisitts': self.cookie}, timeout=10)

            searchResponse = req.text

        except:

            return None

        searchResult = re.findall('<h2><a\shref="(.*?#([0-9]+))".*?>(.*?)</a></h2>', searchResponse)

        if len(searchResult) == 0:

            return None

        links = []

        i = 0

        for result in searchResult:

            a = []

            a.append(result[2] + (' ' + self.getAlbumName(self.base_url + result[0]) if i < 6 else '')) # title from server + album nane

            a.append(self.base_url + result[0]) # url with lyrics

            a.append(artist)

            a.append(title)

            a.append(result[1]) # id of the side part containing this song lyrics

            links.append(a)

            i += 1

        return links


    def findLyrics(self, url, index):

        try:

            headers = {'user-agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:78.0) Gecko/20100101 Firefox/78.0'}

            req = requests.get(url, headers=headers, cookies={'lastvisitts': self.cookie}, timeout=10)

            res = req.text

        except:

            return None

        pattern = '<a\sname="%index%">(.*?)(?:<h3>|<div)' # require multi line and dot all mode

        pattern = pattern.replace('%index%', index)

        match = re.search(pattern, res, re.MULTILINE | re.DOTALL)

        if match:

            s = match.group(1)

            s = s.replace('<br />', '')

            s = s.replace('<i>', '')

            s = s.replace('</i>', '')

            s = s.replace('</a>', '')

            s = s.replace('</h3>', '')

            return s

        else:

            return None


    def getAlbumName(self, url):

        try:

            headers = {'user-agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:78.0) Gecko/20100101 Firefox/78.0'}

            req = requests.get(url, headers=headers, cookies={'lastvisitts': self.cookie}, timeout=10)

            res = req.text

        except:

            return ''

        match = re.search('<h2>(?:album|single|ep|live):?\s?(.*?)</h2>', res, re.IGNORECASE)

        if match:

            return ('(' + match.group(1) + ')').replace('\'', '')

        else:

            return ''


    def get_lyrics(self, song):

        log('%s: searching lyrics for %s - %s' % (__title__, song.artist, song.title), debug=self.DEBUG)

        lyrics = Lyrics(settings=self.settings)

        lyrics.song = song

        lyrics.source = __title__

        lyrics.lrc = __lrc__

        links = self.search(song.artist , song.title)

        if(links == None or len(links) == 0):

            return None

        elif len(links) > 1:

            lyrics.list = links

        lyr = self.get_lyrics_from_list(links[0])

        if not lyr:

            return None

        lyrics.lyrics = lyr

        return lyrics


    def get_lyrics_from_list(self, link):

        title, url, artist, song, index = link

        return self.findLyrics(url, index)

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher
Definition: lyricsScraper.py:25

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.getCookie
def getCookie(self)
Definition: lyricsScraper.py:33

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.searchUrl
searchUrl
Definition: lyricsScraper.py:30

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.settings
settings
Definition: lyricsScraper.py:28

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.base_url
base_url
Definition: lyricsScraper.py:29

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.search
def search(self, artist, title)
Definition: lyricsScraper.py:47

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.getAlbumName
def getAlbumName(self, url)
Definition: lyricsScraper.py:92

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.get_lyrics_from_list
def get_lyrics_from_list(self, link)
Definition: lyricsScraper.py:122

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.findLyrics
def findLyrics(self, url, index)
Definition: lyricsScraper.py:71

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.__init__
def __init__(self, *args, **kwargs)
Definition: lyricsScraper.py:26

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.get_lyrics
def get_lyrics(self, song)
Definition: lyricsScraper.py:105

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.DEBUG
DEBUG
Definition: lyricsScraper.py:27

culrcscrapers.darklyrics.lyricsScraper.LyricsFetcher.cookie
cookie
Definition: lyricsScraper.py:31

utils

xbmc.log
None log(str msg, int level=LOGDEBUG)
Definition: xbmc.py:9