爬虫--百度翻译--能在Python Console里表现岂不是更牛逼(滑稽)

标签: python  ajax  post  爬虫

基于爬虫的一个小操作
就拿“百度翻译”来作为例子

首先导包

import requests

其次,我们要访问这个网站,我把它粘贴到这里
https://fanyi.baidu.com

假如我们输入一个单词,word。我们可以发现,输入单词后,网页并不是跳转了,而是在当前网页显示出翻译结果,因此,我们可以判断出这是ajax的请求操作,那就需要我们打开抓包工具了

在这里插入图片描述
-----------------------------------------------------------------------
抓包工具打开,我们看到框里的sug显示的是我们需要的单词翻译
(如果打开没有这个,可以重新进入网址,因为这个翻译是个请求,你需要打开抓包工具后,再输入查询的单词,就可以了)
在这里插入图片描述
也就是说,如果我们获取到了这个sug的内容,我们就得到了翻译数据。
我们点击Header,看到
Request URL: https://fanyi.baidu.com/sug
继续向下看
Request Method: POST,是个post请求
继续向下
content-type: application/json,是json型的
最后,我们发现,kw:dog(这里注意,kw:dog上面是Form Data,以后爬其他的时候,碰到的可能不止这一个数据,到时候根据情况自行修改)
就是我们输入的单词查询
在这里插入图片描述
接下来写代码

#-*-coding:utf-8-*-
import requests

if __name__=="__main__":
	#访问的地址
    post_url="https://fanyi.baidu.com/sug"
    #UA伪装
    headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36 SLBrowser/6.0.1.9171"}
	
    word = input("输入要查找的单词:")
    data = {"kw": word}
    a = requests.post(url=post_url, data=data, headers=headers)
    interpreter=a.json()
    print(interpreter)

在这里插入图片描述
完成




这样看有点丑,我们根据字典和列表的一些函数,修改为我们看的翻译就行了

实际上把最后一句代码改成

print(interpreter.get("data")[0].get("v"))

就可以了
在这里插入图片描述

搞定

最后,我是通过B站 “up路飞学城” 学习的,刚入手的菜鸟,仅记录我的代码学习,如有更恰当的方式,可以指出来,当然,如有问题也可以共同探讨,共勉。

版权声明:本文为weixin_43905172原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_43905172/article/details/109706588

智能推荐

2018.8.27

2018.8.27...

HTML 表单元素的基本样式

HTML 表单元素的基本样式 原创 ixygj197875 发布于2018-02-22 17:48:53 阅读数 2296 收藏 更新于2018-05-20 15:35:58 分类专栏: 揭秘 CSS 揭秘 CSS 收起 表单元素主要包括 label、input、textarea、select、datalist、******、progress、meter、output等,以及对表单元素进行分组的 ...

php输出语句

php输出语句 常见的输出语句 echo(): 可以一次输出多个值,多个值之间用逗号分隔。echo是语言结构(language construct),而并不是真正的函数,因此不能作为表达式的一部分使用。 print(): 函数print()打印一个值(它的参数),如果字符串成功显示则返回true,否则返回false。 print_r(): 可以把字符串和数字简单地打印出来,而数组则以括起来的键和值...

工厂模式

简介 常见的实例化对象模式。 用工厂方法替代new操作的一种模式。 当我们使用new操作实例化对象时,调用构造函数完成初始化。若初始化仅是进行赋值等简单的操作,写入构造函数即可。但如果初始化时需要执行一长串复杂的代码,将多个工作装入一个方法,是不妥的。 创建实例与使用实例分离。将创建实例所需的大量初始化工作从基类的构造函数中分离出去。 简单工厂模式、工厂方法模式针对的是一个产品等级结构;而抽象工厂...

B1105 Spiral Matrix (画图)

B1105 Spiral Matrix (25分) //第一次只拿了21分 矩阵的长和宽,求最大因子,从sqrt(num)开始枚举. 每次循环一次,s++,t--,d--,r++ 测试点四运行超时,是因为输入一个数字的时候,需要直接输出这个数字。//1分 测试点二运行超时,最后一个数字不必再while循环一次,直接输出即可。//3分 最后一个测试点卡了好久/(ㄒoㄒ)/~~ 螺旋矩阵...

猜你喜欢

Java基础=>String,StringBuffer与StringBuilder的区别

字符串常量池 什么是字符串常量池? JVM为了减少字符串对象的重复创建,其维护了一块特殊的内存,这段内存被称为字符串常量池(存储在方法区中)。 具体实现 当代码中出现字符串时,JVM首先会对其进行检查。 如果字符串常量池中存在相同内容的字符串对象,如果有,则不再创建,直接返回这个对象的地址返回。 如果字符串常量池中不存在相同内容的字符串对象,则创建一个新的字符串对象并放入常量池,并返回新创建的字符...

java调用其他java项目的Https接口

项目中是这样的: 用户拿出二维码展示,让机器识别二维码, 机器调用开门的后台系统接口, 然后开门的后台系统接口需要调用管理系统的接口, 管理系统需要判断能不能开门.这两个系统是互相独立的.当时使用http调用是没有问题的.当时后来要求必须用https.废话不说,直接代码: 我的项目中调用的是 HttpsUtils.Get(utlStr) 这个接口 开门系统接口如下图:   管理系统的接口...

Hadoop1.2.1全分布式模式配置

一 集群规划 主机名            IP                               安装的软件 &nbs...

Go语言gin框架的安装

尝试安装了一下gin,把遇到的一些小问题来记录一下 安装步骤 首先来看看官方文档,链接点这里 可以看到安装步骤很简单,就一句话 在命令行中输入这句话运行等待就好。 问题来了,因为墙的问题,go get会很慢,所以命令行里面半天什么反应也没有,不要急,慢慢等着就会看到gin-gonic/gin这个目录出现 这个时候命令行还是没有结束,表示还在下一些东西。有的时候可能心急的人就停了(比如我),然后写个...

uni-app表单组件二

input(输入框) 属性名 类型 说明 平台差异 value String 输入框的初始内容 type String input 的类型 password Boolean(默认false) 是否是密码类型 placeholder String 输入框为空时占位符 placeholder-style String 指定 placeholder 的样式 placeholder-class Strin...