def login_qq():
    # 切换 iframe
    browser.switch_to.frame("frame_tips")
    wait.until(lambda browse: browser.find_element_by_id("switcher_plogin"))
    sleep(0.5)
    browser.find_element_by_id("switcher_plogin").click()
    user_input = browser.find_element_by_id("u")
    user_input.send_keys("account")
    pwd_input = browser.find_element_by_id("p")
    pwd_input.send_keys("password")
    submit = browser.find_element_by_id("login_button")
    submit.click()
    # 登录成功以后要切换回来
    browser.switch_to.default_content()

搜索歌曲以及添加到歌单中

这里找到 qq 音乐的搜索 url 然后把关键字填入就好. 搜索到歌曲以后, 我这里比较偷懒, 只选择把第一个搜索到的结果添加进去. 添加的操作实际上分为三步:

鼠标移到歌曲上
点击 '+' 图标
点击歌单这里我测试了好几种方法. 最后发现还是直接使用 javascript 来操作成功率比较高. 另外一方面, 可以直接在浏览器 console 里面直接测试 js 操作, 测试比较方便

def add_song():
    # 点击出歌单
    browser.execute_script("document.getElementsByClassName('songlist__list')[0].firstElementChild.getElementsByClassName('list_menu__add')[0].click()")
    sleep(0.5)
    # 通过 data-dirid 来选择歌单
    browser.find_element_by_css_selector("a[data-dirid='{}']".format(playlist_id)).click()
    return

打包 exe 执行文件

选择使用 py2exe 来打包. 这里有个坑就是由于我们用到了 selenium, selenium 里面的某些函数依赖了两个 js 文件, 需要把这两个 js 文件添加到打包的脚本里面

from distutils.core import setup
import py2exe
from glob import glob

setup(
    console=["run.py"],
    data_files=[
        (r'.', glob(r'D:\myproject\syncPlaylist\config.json')),
        (r'.', glob(r'D:\ProgramData\Anaconda3\envs\python27\Lib\site-packages\selenium\webdriver\remote\getAttribute.js')),
        (r'.', glob(r'D:\ProgramData\Anaconda3\envs\python27\Lib\site-packages\selenium\webdriver\remote\isDisplayed.js'))
    ]
)

关于重试

在执行脚本过程中发现, 偶尔会出现点击登录以后 qq 登录还是没成功的情况, 以及添加歌曲时, 脚本偶尔会出错. 这里为了不中断整个脚本执行, 有必要加上重试这个操作, 因此写了一个重试的装饰器

def retry(retry_times=0, exc_class=Exception, notice_message=None):
    """retry_times: 重试次数
    exc_class: 捕捉的异常 class
    notice_message: 发生异常时候输出的错误信息, 为 None 时则不输出
    """
    def wrapper(f):
        @functools.wraps(f)
        def inner_wrapper(*args, **kwargs):
            current = 0
            while True:
                try:
                    return f(*args, **kwargs)
                except exc_class as e:
                    if current >= retry_times:
                        raise RetryException()
                    if notice_message:
                        print notice_message
                    current += 1
        return inner_wrapper
    return wrapper

总结以及剩余的问题

说实话, 本来以为写这个脚本难度不是很大. 但前前后后差不多花了两三天的时间 T_T. 问题在于之前爬虫这方面不是很熟悉以及项目结构在一开始比较混乱(其实就是懒= =). 平时也比较少写这种技术分享的 blog, 有什么问题大家多多指教, 乐意接受批评.

第 1 条附言 · 2017-06-20 00:35:32 +08:00

... 看来大家都想从 qq 同步到网易去= =
我这几天搞一个反向的吧

脚本

Selenium

element

Python

16 条回复 • 2017-06-20 15:24:06 +08:00

bearqq

2017-06-19 14:22:59 +08:00

for _ in range(0,retry_times):
try:
dosomething()
break#执行成功，跳出 for
exception:
continue
else:#for 执行完毕未跳出，即错误次数超出
raise RetryException()
return
return "success"

我一般这么 retry
-。-