首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
admin
2021-03-17
103
问题
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。
问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.txt”,每行一个词。例如:
内容简介
编辑
整个
故事
在
东汉
……
在考生文件夹下给出了程序框架文件“PY301-1.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出的代码
import jieba
f=open(’data.txt’,’r’)
lines=f.readlines()
f.close()
f=open(’out.txt’.’w’)
for line in lines:
line=________(1)________ #删除每行首尾可能出现的空格
wordList=________(2)________ #用jieba库对每行内容进行分词
f.writelines(’\n’________((3)________))#将分词结果存到文件out.txt中
f.close()
问题2:对文件“out.txt”进行分析,输出“曹操”出现的次数。
在考生文件夹下给出了程序框架文件“PY301-2.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出代码
import jieba
f=open(’out.txt’,’r’) #以只读模式打开文件
words=f.readlines()
f.close()
D={}
for w in________(1)________: #词频统计
D[w[:-1]]=________(2)________+1
print("曹操出现次数为:{}".format(________(3)________))
选项
答案
(1)import jieba f=open(’data.txt’.’r’) lines=f.readlines() f.close() f=open(’out.txt’,’w’) for line in lines: line=line.strip() wordList=jieba.lcut(line) f.writelines(’\n’.join(wordList)) f.close() (2)import jieba f=open(’out.txt’,’r’) words=f.readlines() f.close() D={} for w in words: D[w[:-1]=D.get(w[:-1],0)+1 print("曹操出现次数为:{}".format(D["曹操"]))
解析
(1)本题要使用jieba库,首先用import关键字引用jieba库。打开“data.txt”文件后,需要用readlines()函数读入所有行,以每行为元素形成列表lines。然后用for循环遍历该列表中的每个元素并进行分词。在遍历每个元素时,首先用strip()方法删除元素首尾出现的空格。因此第1空填入line.strip();再使用jieba库的lcut()方法对元素进行精准分词。因此第2空填入jieba.1cut(line);最后将换行符插入每个词组之间,并写入文件“out.txt”中。因此第3空填入join(wordList)。
(2)首先用import关键字引用jieba库。打开“out.txt”文件后,需要用readlines()方法读入所有行,以每行为元素形成列表words,然后用for循环遍历该列表中每个元素出现的次数。因此,第1空填入words。
在遍历每个元素时,若字典D中没有键与该元素相同,就将该元素作为字典D的一个键,该键所对应的值置为1;若字典D中存在键与该元素相同,就将该键对应的值加1。因此,第2空填入D.get(w[:-1],0)。
题目要求的是输出“曹操”出现的次数,字典D中键“曹操”对应的值即为该词出现的次数。因此,第3空填入D["曹操"]。
转载请注明原文地址:https://www.kaotiyun.com/show/si6p777K
本试题收录于:
二级Python题库NCRE全国计算机二级分类
0
二级Python
NCRE全国计算机二级
相关试题推荐
在考生文件夹下完成下列操作:(1)建立一个文件名和表单名均为myform的表单,表单中包括一个列表框(Liat1)和两个命令按钮(Command1和Command2),两个命令按钮的标题分别为“计算”和“退出”。(2)列表框(List1)中应显示组号
在考生文件夹下完成下列操作。(1)在TheatDB数据库中新建一个名为“好评”的视图,视图的功能是查询2013年7月1日以后(不含)观看的“影评”为“好”的评价数最多的前10名的电影信息;查询结果包含电影编号、电影名、类型和评价数;各记录按照评价数降序排
在考生文件夹下完成下列操作。(1)新建“机票”数据库,将考生文件夹下的所有自由表添加到该数据库中。(2)在“机票”数据库中的“机票打折”表中设置“折扣”字段的有效性规则只能为“1和10之间的数值”(含1和10)。(3)为“机票价格”表的“序号”字段创
在考生文件夹下完成下列简单应用:1.修改并执行程序four.prg,该程序的功能是:根据“学院表”和“教师表”计算“信息管理”系教师的平均工资。注意:只能修改标有错误的语句行,不能修改其他语句。2.在College数据库中使用视图设计器建立一个名为co
设N=44,M=55,K=“N+M”,表达式1+&K的值是()。
要控制两个表中数据的完整性和一致性可以设置“参照完整性”,要求这两个表()。
在下面的表达式中,运算结果是逻辑假的是()。
下列关于SQL对表的定义的说法中,不正确的选项是()。
(1)student是一个“学牛”表,其中包含学号(c8)、姓名(C8)、性别(c2)、政治面目(C4)、班级(C5)等字段。考生文件夹下的modil.prg程序文件的功能是显示输出所有政治面目为“群众”的“男”生的姓名和班级,每行输出一个学生的
设计一个表单名为myform2的表单,表单文件名为myform2,表单的标题为“教师课程学生基本信息浏览”。表单上有1个包含3个选项卡的“页框”(Pageframe1)控件和一个“退出”按钮(command1),如图3-20所示。其他功能要求如下:
随机试题
女,23岁,停经40天。尿液检查妊娠试验阳性,表示其尿内含有
试论公民的政治权利及其宪法地位。
()适用于被批准于短期贷款、长期循环贷款和其他类型的授信贷款的最高的本金风险敞口额度。
“预收账款”科目所属明细科目的借方余额,在编制资产负债表时应反映在( )项目中。
在A班的班会课上,黄老师兴致勃勃地给学生发奖,六名成绩优秀的学生在阵阵掌声中陆续走上讲台,手捧“三好学生”大红奖状和笔记本,台下五十多双羡慕的眼光,更增添了他们的光彩和豪气。在领奖时,黄老师大力表扬了这6名学生的优点和骄人的成绩,号召大家向他们学习,争创优
著名管理学家德鲁克曾经指出:“政府履行社会职责的能力是极为有限的,而非营利部门可以发挥巨大的作用”。下列表述正确的有:
我国《宪法》规定,全国人大代表在全国人大各种会议上的发言和表决不受法律追究。此项权利被称为()。
下列哪项不是城市生态系统物质循环的特点?()
按照价格理论,成本是产品价值的基础组成部分,它决定着产品价格的最低界限,如果价格低于成本,企业便无利可图;市场需求影响顾客对产品价值的认识,进而决定着产品价格的上限,而市场竞争状况则调节着价格在上限和下限之间不断波动并最终确定产品的市场价格。这段话的主要意
Howhardistogetbeautifulhair?Beautifulhaircannotbetakenforgranted.Environmentalfactors,chemicaltreatmentsan
最新回复
(
0
)