当前位置: 移动技术网 > IT编程>脚本编程>Python > python爬虫调用谷歌翻译接口

python爬虫调用谷歌翻译接口

2019年07月04日  | 移动技术网IT编程  | 我要评论

木脑男,朱五六,阎启俊的儿子

2019年7月4日15:53:17

    (¦3[▓▓] 晚安
    

谷歌翻译环境

python 3.6
第三方库 execjs (pip install pyexecjs
)

文件列表

同目录下的四个文件:

    - tool.py
    - google_translate.py 
    - input.txt
    - __init__.py


主要有四个文件
    1、tool.py (用来生成谷歌翻译url中的tk字段)
    2、google_translate.py (用来读取中文txt文件,并翻译生成新的德语txt文件)
    3、input.txt(需要翻译的txt中文文件)
    4、__init__.py(该文件为空文件,用来impot handlejs.py)
    详细可以百度"python3 引用同目录py文件"
    

使用步骤

注:这里是中文文本转换为德语文本

1、同目录下创建四个文件,分别将下边代码粘贴上去
2、运行 python3 google_translate.py或 python google_translate.py生成output.txt

修改说明

本文件是中文翻译为德语的,如果要转换为其他语言
请修改 google_translate.py 文件里的 translate()函数的以下字段。

关于语言代码和国家的对应,请查看"国家语言代码对照表"文章。
如:中文 zh-cn
    德语 de
    英语 en

    old_language_code = "zh-cn" # 中文
    new_language_code = "de"  # 德语
    # new_language_code = "en" # 英语

tool.py

注:用来生成谷歌翻译url中的tk字段
import execjs


class py4js():

    def __init__(self):
        self.ctx = execjs.compile("""
        function tl(a) {
        var k = "";
        var b = 406644;
        var b1 = 3293161072;

        var jd = ".";
        var $b = "+-a^+6";
        var zb = "+-3^+b+-f";

        for (var e = [], f = 0, g = 0; g < a.length; g++) {
            var m = a.charcodeat(g);
            128 > m ? e[f++] = m : (2048 > m ? e[f++] = m >> 6 | 192 : (55296 == (m & 64512) && g + 1 < a.length && 56320 == (a.charcodeat(g + 1) & 64512) ? (m = 65536 + ((m & 1023) << 10) + (a.charcodeat(++g) & 1023),
            e[f++] = m >> 18 | 240,
            e[f++] = m >> 12 & 63 | 128) : e[f++] = m >> 12 | 224,
            e[f++] = m >> 6 & 63 | 128),
            e[f++] = m & 63 | 128)
        }
        a = b;
        for (f = 0; f < e.length; f++) a += e[f],
        a = rl(a, $b);
        a = rl(a, zb);
        a ^= b1 || 0;
        0 > a && (a = (a & 2147483647) + 2147483648);
        a %= 1e6;
        return a.tostring() + jd + (a ^ b)
    };

    function rl(a, b) {
        var t = "a";
        var yb = "+";
        for (var c = 0; c < b.length - 2; c += 3) {
            var d = b.charat(c + 2),
            d = d >= t ? d.charcodeat(0) - 87 : number(d),
            d = b.charat(c + 1) == yb ? a >>> d: a << d;
            a = b.charat(c) == yb ? a + d & 4294967295 : a ^ d
        }
        return a
    }
    """)

    def gettk(self, text):
        return self.ctx.call("tl", text)

google_translate.py

    注:用来读取中文txt文件,并翻译生成新的德语txt文件
# -*- coding: utf-8 -*-

import urllib.request
from tool import py4js


def open_url(url):
    headers = {'user-agent': 'mozilla/5.0 (windows nt 6.1; wow64; rv:23.0) gecko/20100101 firefox/23.0'}
    req = urllib.request.request(url=url, headers=headers)
    response = urllib.request.urlopen(req)
    data = response.read().decode('utf-8')
    return data


def translate(content, tk):
    if len(content) > 4891:
        print("翻译的长度超过限制!!!")
        return

    content = urllib.parse.quote(content)

    old_language_code = "zh-cn"
    # new_language_code = "en" # 英语
    new_language_code = "de"  # 德语
    url = "https://translate.google.cn/translate_a/single?client=webapp&" \
          "sl=%s&tl=%s&hl=en&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss&dt=t&clearbtn=1&otf=1&" \
          "pc=1&ssel=3&tsel=3&kc=2&tk=%s&q=%s" % (old_language_code, new_language_code, tk, content)

    result = open_url(url)

    end = result.find("\",")
    if end > 4:
        print(result[4:end])
        return result[4:end]


def get_old_text_list():
    key_str_list = list()
    with open("input.txt", "r") as fo:
        lines = fo.readlines()

    for line in lines:
        if "'" in line and ":" in line and "," in line:
            line_list = line.split("'")
            line_str = line_list[-2]
            if line_str != "react admin":
                key_str_list.append(line_str)
                print(line_str)
    return key_str_list


def get_new_text_list(key_str_list):
    js = py4js()

    value_str_list = list()
    key_value_dict = dict()
    for key in key_str_list:
        content = key

        if content == 'q!':
            break

        tk = js.gettk(content)
        value = translate(content, tk)
        value_str_list.append(value)

        key_value_dict[key] = value
    print(key_str_list)
    print(value_str_list)
    print(key_value_dict)
    return value_str_list, key_value_dict


def output_new_text(key_str_list, value_str_list, key_value_dict):
    with open("input.txt", "r") as fo:
        lines = fo.readlines()

    with open("output.txt", "w") as fw:
        for line in lines:
            for key in key_str_list:
                if key in line:
                    line = line.replace(key, key_value_dict[key])
                    fw.write(line)


def main():
    key_str_list = get_old_text_list()
    value_str_list,key_value_dict = get_old_text_list(key_str_list)

    output_new_text(key_str_list, value_str_list, key_value_dict)


if __name__ == "__main__":
    main()

inpupt.txt

    注:需要翻译的txt中文文件
export default {
    application: {
        name: 'react admin',
    },
    ajaxtip: {
        success: '成功',
        error: '失败',
        noaccess: '无权访问此资源',
        notfound: '访问资源不存在',
        serverbusy: '服务器繁忙',
        timeout: '超时',
    },
    menu: {
        menus: '菜单&权限',
        codegenerator: '代码生成',
        home: '首页',
        document: '文档',
        page404: '404页面不存在',
        login: '登录',
        example: '示例',
        usercenter: '用户中心',
        users: '用户列表',
        useredit: '用户编辑',
        roles: '角色列表',
        modifypassword: '修改密码',
        setting: '设置',
        logout: '退出登录',
        ajax: 'ajax请求',
        antdesign: 'ant design 官网',
        google: '谷歌官网',

        component: '组件',
        tablerowdraggable: '表格行可拖拽',
        asyncselect: '异步下拉',
        formelement: '表单元素',
        formitemlayout: '表单布局',
        formutil: '表单相关工具',
        inputclear: '可清空input',
        listpage: '列表页',
        modal: '弹框',
        nodata: '暂无数据',
        operator: '操作',
        pagination: '分页组件',
        permission: '权限',
        popprompt: '弹框输入',
        querybar: '查询条',
        queryitem: '查询条件',
        tableanimate: '表格动画高阶组件',
        tabledragcolumn: '表头拖拽高阶组件',
        tabledragrow: '表格行可拖拽高阶组件',
        tableeditable: '可编辑表格',
        tablerightclick: '表格行右键高阶组件',
        toolbar: '工具条',
        useravatar: '用户头像',
    },
    login: {
        title: '欢迎登录',
        submit: '登录',
        username: '用户名',
        password: '密码',
        usernameemptytip: '请输入用户名!',
        passwordemptytip: '请输入密码!',
    },
    setting: {
        navigationlayout: '导航布局',
        topsidemenu: '顶部+左侧导航',
        topmenu: '顶部导航',
        sidemenu: '左侧导航',
        tabssetting: 'tab页导航设置',
        tabsshow: '显示tab页导航',
        pagesetting: '页面设置',
        showhead: '显示头部',
        fixedhead: '头部固定',
        menusetting: '菜单设置',
        keepmenuopen: '保持菜单展开',
        keeppage: '保持页面状态',
        fullscreen: '全屏显示',
        exitfullscreen: '退出全屏',
        selectprimarycolor: '选择主题颜色',
    },
    tabs: {
        refresh: '刷新',
        refreshall: '刷新全部',
        close: '关闭',
        closeothers: '关闭其他',
        closeall: '关闭所有',
        closeleft: '关闭左侧',
        closeright: '关闭右侧',
    },
    errorpage: {
        needlogin: '您还未登录!',
        pagenotfound: '您访问的页面不存在!',
        redirectto: '跳转到',
        orreturn: '或者返回',
        previousstep: '上一步',
    },
};

--

output.txt

    注:最终生成文件
 {
    application: {
        name: 'react admin',
    },
    ajaxtip: {
        success: 'erfolg',
        error: 'misserfolg',
        noaccess: 'nicht berechtigt, auf diese ressource zuzugreifen',
        notfound: 'zugriffsressourcen sind nicht vorhanden',
        serverbusy: 'server ausgelastet',
        timeout: 'timeout',
    },
    menu: {
        menus: 'menü \u0026 berechtigungen',
        codegenerator: 'codegenerierung',
        home: 'zuhause',
        document: 'dokument',
        page404: '404 seite existiert nicht',
        login: 'einloggen',
        example: 'beispiel',
        usercenter: 'benutzerzentrum',
        users: 'benutzerliste',
        useredit: 'benutzerbearbeitung',
        roles: 'rollenliste',
        modifypassword: 'passwort ändern',
        setting: 'einstellung',
        logout: 'abmelden',
        ajax: 'ajax-anfrage',
        antdesign: 'offizielle website von ant design',
        google: 'googles offizielle website',

        component: 'komponente',
        tablerowdraggable: 'tabellenzeilen können gezogen werden',
        asyncselect: 'asynchroner pulldown',
        formelement: 'formularelement',
        formitemlayout: 'formularlayout',
        formutil: 'formularbezogene werkzeuge',
        inputclear: 'kann eingabe löschen',
        listpage: 'listenseite',
        modal: 'einschussfeld',
        nodata: 'noch keine daten',
        operator: 'bedienung',
        pagination: 'paging-komponente',
        permission: 'erlaubnis',
        popprompt: 'bullet-box-eingabe',
        querybar: 'abfrageleiste',
        queryitem: 'abfragebedingung',
        tableanimate: 'übergeordnete komponenten für die tabellenanimation',
        tabledragcolumn: 'header, der high-end-komponenten zieht',
        tabledragrow: 'tabellenzeilen können übergeordnete komponenten ziehen',
        tableeditable: 'bearbeitbares formular',
        tablerightclick: 'klicken sie mit der rechten maustaste auf die übergeordnete komponente in der tabellenzeile',
        toolbar: 'symbolleiste',
        useravatar: 'benutzeravatar',
    },
    login: {
        title: 'willkommen anmelden',
        submit: 'einloggen',
        username: 'benutzername',
        password: 'passwort',
        usernameemptytip: 'bitte geben sie ihren benutzernamen ein!',
        passwordemptytip: 'bitte geben sie ihr passwort ein!',
    },
    setting: {
        navigationlayout: 'navigationslayout',
        topsidemenu: 'navigation oben + links',
        topmenu: 'top navigation',
        sidemenu: 'linke navigation',
        tabssetting: 'einstellungen für die registerkartennavigation',
        tabsshow: 'registerkartennavigation anzeigen',
        pagesetting: 'seite einrichten',
        showhead: 'anzeigekopf',
        fixedhead: 'kopffixierung',
        menusetting: 'menüeinstellung',
        keepmenuopen: 'lassen sie das menü geöffnet',
        keeppage: 'seitenstatus beibehalten',
        fullscreen: 'vollbildanzeige',
        exitfullscreen: 'beenden sie den vollbildmodus',
        selectprimarycolor: 'wählen sie die themenfarbe',
    },
    tabs: {
        refresh: 'aktualisieren',
        refreshall: 'aktualisieren sie alle',
        close: 'schliessen',
        closeothers: 'andere schließen',
        closeall: 'alles schließen',
        closeleft: 'links schließen',
        closeright: 'nach rechts schließen',
    },
    errorpage: {
        needlogin: 'du bist nicht eingeloggt!',
        pagenotfound: 'die von ihnen besuchte seite existiert nicht!',
        redirectto: 'springe zu',
        orreturn: 'oder zurück',
        previousstep: 'vorheriger schritt',
    },
}

参考文献:

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网