南开22春(高起本1709、全层次1803-2103)《网络爬虫与信息提取》在线作业1题目

[复制链接]
发表于 2022-5-16 09:06:24 | 显示全部楼层 |阅读模式
22春学期(高起本1709、全层次1803-2103)《网络爬虫与信息提取》在线作业
1.[单选题] PyMongo中逻辑查询表示小于的符号是()
答案资料下载请参考帮助中心说明
    A.$gt
    B.$lt
    C.$gte$$lte
    答:——B——
2.[单选题] 在Mac OS下安装MongoDB使用命令() install mongodb
    A.brew
    B.apt-get
    C.sudo
    D.apt
    答:——A——
3.[单选题] 服务器端记录信息确定用户身份的数据是
    A.session
    B.cookies
    C.moonpies
    D.localstorage
    答:——A——
4.[单选题] 在Scrapy工程的settings.py文件中,哪个配置项,如果设置为True,那么Scrapy就会自动跳过网站不允许爬取的内容()
    A.ROBOTSTXT_ OBEY
    B.ROBOTSTXT_JUDGE
    C.ROBOTSTXT
    D.ROBOTSTXT_ IF
    答:————
5.[单选题] 下列哪项不是HTTP的请求类型()
    A.GET
    B.POST
    C.PUT
    D.SET
    答:————
6.[单选题] 使用UI Automator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令()
    A.content
    B.text
    C.title
    D.body
    答:————
7.[单选题] 当爬虫运行到yield scrapy.Request()或者yield item的时候,下列哪个爬虫中间件的方法被调用?
    A.process_spider_output()
    B.process_spider_exception()
    C.process_spider_input()
    D.process_start_ requests()
    答:————    天津大学答案无忧答案网整理
8.[单选题] Redis中查看一个列表长度,使用关键字()
    A.len
    B.length
    C.llen
    D.count
    答:————
9.[单选题] Python中列表可以用()方法在末尾添加元素
    A.add
    B.append
    C.plus
    D.+
    答:————
10.[单选题] 打开终端,输入(),屏幕上会出现Python的路径
    A.python path
    B.path python
    C.which python
    D.python which
11.[单选题] python中可以用来将图片中的文字转换为文本的第三方类库是
    A.lxml
    B.requests
    C.beautifulsoup
    D.pytesseract
    答:————
12.[单选题] Redis中如果不删除列表中的数据,又要把数据读出来,就需要使用关键字()
    A.range
    B.lrange
    C.srange
    D.pop
    答:————
13.[单选题] 请问按哪个键可以打开Chrome自带的开发者工具()
    A.F10
    B.F1
    C.F11
    D.F12
14.[单选题] Python操作CSV文件可通过()容器的方式操作单元格
    A.列表
    B.元组
    C.字典
    D.集合
    答:————
15.[单选题] 当需要把Python里面的数据发送给网页时,需要先转换成()字符串
    A.Python
    B.Json
    C.正则表达式
    D.Ajax
    答:————
16.[单选题] Python中Object=[1, 2, 3, 4, 5],则Objcet是()
    A.列表
    B.元组
    C.字典
    D.集合
17.[单选题] Python中若定义object="12345",则print(object[::-1])输出()
    A.1
    B.5
    C.54321
    D.程序报错
    答:————
18.[单选题] HTTP状态码401表示
    A.请求报文中可能存在语法错误
    B.请求需要通过HTTP认证
    C.请求资源的访问被拒绝
    D.服务器上没有请求的资源
19.[单选题] 如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()
    A.列表
    B.元组
    C.字典
    D.集合
    答:————
20.[单选题] 在Python中,为了使用XPath,需要安装一个第三方库()
    A.lxml
    B.xml
    C.xpath
    D.path
    答:————
21.[多选题] 针对解析源代码的BeautifulSoup对象,构造时BeautifulSoup(网页源代码, '解析器')中的解析器可以为()
    A.html
    B.html.parser
    C.lxml
    D.xml
    答:————
22.[多选题] MongoDB中获取名字为set1的集合的语句为()
    A.database.set1
    B.database('set1')
    C.database['set1']
    D.database{'set1'}
    答:————
23.[多选题] 下列说法错误的是()
    A.mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本,并在Python脚本里面直接操作HTTP和HTTPS的请求,以及返回的数据包。
    B.命令行中执行mitmdump -s parse_request.py即可运行python 脚本
    C.使用python可以自定义返回的数据包,如 response.headers,就是返回的头部信息
    D.如果返回的是JSON类型的字符串,python无法进行解析。
    答:————
24.[多选题] 使用BeautifulSoup对象后可以使用()来查找内容
    A.find_all
    B.find
    C.search
    D.search_all
    答:————
25.[多选题] 以下哪些可以独立成为Python编译器()
    A.Pycharm
    B.IDLE
    C.Eclipse
    D.Visual Studio 2010
    答:————
26.[多选题] Redis中的值可以支持()
    A.列表
    B.哈希
    C.集合
    D.有序集合
    答:————
27.[多选题] 要使用tesseract来进行图像识别,需要安装两个第三方库
    A.requests
    B.beautifulsoup
    C.Pillow
    D.pytesseract
28.[多选题] 在配置ios使用Charles的操作中,正确的有()
    A.对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
    B.选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888
    C.输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
    D.安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任
    答:————
29.[多选题] 以下HTTP状态码表示服务器本身发生错误的是
    A.400
    B.503
    C.302
    D.500
    答:————
30.[多选题] 以下HTTP状态码表示服务器没有正常返回结果的是
    A.200
    B.301
    C.404
    D.500
    答:————
31.[判断题] Python中字符串切片以后的结果还是字符串
    A.对
    B.错
    答:————
32.[判断题] 打码平台都是靠机器使用OCR技术识别图片上的文字。
    A.对
    B.错
    答:————
33.[判断题] 验证码必须通过手动填充识别。
    A.对
    B.错
    答:————
34.[判断题] 代理中间件的可用代理列表一定要写在settings.py里面
    A.对
    B.错
    答:————
35.[判断题] charles配置中,安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任。
    A.对
    B.错
    答:————
36.[判断题] MongoDB 是一个基于分布式文件存储的数据库,,速度远快过Redis
    A.对
    B.错
37.[判断题] 爬虫的源代码通过公开不会对被爬虫网站造成影响
    A.对
    B.错
    答:————
38.[判断题] 一般来说在页面都通过GET将用户登录信息传递到服务器端。
    A.对
    B.错
    答:————
39.[判断题] 爬虫文件无法从Pycharm运行和调试,只能通过命令行的方式运行。
    A.对
    B.错
    答:————
40.[判断题] 通用搜索引擎的目标是尽可能大的网络覆盖率,搜索引擎服务器资源与网络数据资源互相匹配
    A.对
    B.错
    答:————
41.[判断题] Python中相比于findall方法,search方法对于从超级大的文本里面只找第1个数据特别有用,可以大大提高程序的运行效率。
    A.对
    B.错
    答:————
42.[判断题] MongoDB URI的格式为:
mongodb://服务器IP或域名:端口@用户名:密码
    A.对
    B.错
    答:————
43.[判断题] Redis中查询列表长度命令llen中l代表left,即从左侧开始数
    A.对
    B.错
    答:————
44.[判断题] middlewares.py是下载器中间件
    A.对
    B.错
    答:————
45.[判断题] 需要实名认证的打码网站更加安全可靠。
    A.对
    B.错
    答:————
46.[判断题] 开源库pytesseract的作用是将图像中文字转换为文本。
    A.对
    B.错
    答:————
47.[判断题] 要实现Charles对Android抓包,其过程比iOS稍微复杂一点。这是因为不同的Andorid设备,安装证书的入口可能不一样
    A.对
    B.错
    答:————
48.[判断题] Python中包含字典的列表页可以转换成JSON字符串
    A.对
    B.错
    答:————
49.[判断题] 在有spiders何setting.py这两项的情况下,可以写出爬虫并且保存数据,items.py和pipelines.py文件是原作者的失误而导致的冗余文件。
    A.对
    B.错
50.[判断题] Python中函数返回值的个数可以是多个
    A.对
    B.错
    答:————

核对题目下载 转载注明无忧答案网
快速回复 返回顶部 返回列表