首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。 问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.tx
admin
2021-03-17
116
问题
《三国演义》是中国古典四大名著之一,曹操是其中的主要人物,考生文件夹下文件“data.txt”给出《三国演义》简介。
问题1:请编写程序,用Python中文分词第三方库jieba对文件“data.txt”进行分词,并将结果写入文件“out.txt”,每行一个词。例如:
内容简介
编辑
整个
故事
在
东汉
……
在考生文件夹下给出了程序框架文件“PY301-1.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出的代码
import jieba
f=open(’data.txt’,’r’)
lines=f.readlines()
f.close()
f=open(’out.txt’.’w’)
for line in lines:
line=________(1)________ #删除每行首尾可能出现的空格
wordList=________(2)________ #用jieba库对每行内容进行分词
f.writelines(’\n’________((3)________))#将分词结果存到文件out.txt中
f.close()
问题2:对文件“out.txt”进行分析,输出“曹操”出现的次数。
在考生文件夹下给出了程序框架文件“PY301-2.py”,补充代码完成程序。
试题程序:
#请在________处使用一行代码或表达式替换
#注意:请不要修改其他已给出代码
import jieba
f=open(’out.txt’,’r’) #以只读模式打开文件
words=f.readlines()
f.close()
D={}
for w in________(1)________: #词频统计
D[w[:-1]]=________(2)________+1
print("曹操出现次数为:{}".format(________(3)________))
选项
答案
(1)import jieba f=open(’data.txt’.’r’) lines=f.readlines() f.close() f=open(’out.txt’,’w’) for line in lines: line=line.strip() wordList=jieba.lcut(line) f.writelines(’\n’.join(wordList)) f.close() (2)import jieba f=open(’out.txt’,’r’) words=f.readlines() f.close() D={} for w in words: D[w[:-1]=D.get(w[:-1],0)+1 print("曹操出现次数为:{}".format(D["曹操"]))
解析
(1)本题要使用jieba库,首先用import关键字引用jieba库。打开“data.txt”文件后,需要用readlines()函数读入所有行,以每行为元素形成列表lines。然后用for循环遍历该列表中的每个元素并进行分词。在遍历每个元素时,首先用strip()方法删除元素首尾出现的空格。因此第1空填入line.strip();再使用jieba库的lcut()方法对元素进行精准分词。因此第2空填入jieba.1cut(line);最后将换行符插入每个词组之间,并写入文件“out.txt”中。因此第3空填入join(wordList)。
(2)首先用import关键字引用jieba库。打开“out.txt”文件后,需要用readlines()方法读入所有行,以每行为元素形成列表words,然后用for循环遍历该列表中每个元素出现的次数。因此,第1空填入words。
在遍历每个元素时,若字典D中没有键与该元素相同,就将该元素作为字典D的一个键,该键所对应的值置为1;若字典D中存在键与该元素相同,就将该键对应的值加1。因此,第2空填入D.get(w[:-1],0)。
题目要求的是输出“曹操”出现的次数,字典D中键“曹操”对应的值即为该词出现的次数。因此,第3空填入D["曹操"]。
转载请注明原文地址:https://www.kaotiyun.com/show/si6p777K
本试题收录于:
二级Python题库NCRE全国计算机二级分类
0
二级Python
NCRE全国计算机二级
相关试题推荐
设计一个名为form_book的表单,表单的控件名为forml,文件名为form_book,表单的标题为“图书情况统计”。表单中有一个组合框(名称为Combol)、一个文本框(名称为Text1)、两个命令按钮“统计”和“退出”(名称为Command1和Co
1.在考生文件夹下打开数据库文件“大学管理”,为其中的“课程表”和“教师表”分别建立主索引和普通索引,字段名和索引名均为“课程号”。2.打开one.prg文件,修改其中的一处错误,使程序执行的结果是在屏幕上显示:5
在考生文件夹下完成下列操作。(1)新建“机票”数据库,将考生文件夹下的所有自由表添加到该数据库中。(2)在“机票”数据库中的“机票打折”表中设置“折扣”字段的有效性规则只能为“1和10之间的数值”(含1和10)。(3)为“机票价格”表的“序号”字段创
在考生文件夹下完成如下操作:1.my_menu菜单中的“文件”菜单项下有子菜单项“新建”、“打开”、“关闭”和“退出”,请在“关闭”和“退出”之间添加一条水平的分组线,并为“退出”菜单项编写一条返回到系统菜单的命令(不可以使用过程)。2.创建一个快速报
进行字符串比较时,使命令:?”我们大家”=”我们”,结果为逻辑假的设置是()。
内聚性是对模块功能强度的衡量,下列选项中,内聚性较弱的是()。
页框控件也称作选项卡控件,在一个页框中可以有多个页面,页面个数的属性是()。
下列程序段执行以后,内存变量A和B的值是CLEARA=10B=20SETUDFPARMSTOREFERENCEDOSQWITH(A),(B)&&参数A是值传递,B是值传递?A,B
在VisualFoxPro中,通常以窗口形式出现,用以创建和修改表、表单、数据库等应用程序组件的可视化工具称为
某二叉树有5个度为2的结点,则该二叉树中的叶子结点数是
随机试题
Thepoeticline"Ifwintercomes,canspringbefarbehind?"isquotedfrom______.
男性,66岁,良性前列腺增生,一般状况良好,残余尿量达60ml,首选的治疗方法是
A.软骨样组织 B.牙乳头样组织 C.筛孔样结构 D.牙体组织 E.黏液样细胞、表皮样细胞和中间细胞多形性腺瘤中有
为了使铸造全冠既便于取戴,又能获得良好的固位,牙齿各轴面的预备要求
当导热过程在两个直接接触的固体表面之间进行,为了减小接触热阻,下列做法错误的是()。
下列关于混凝土粗骨料的质量要求说法正确的是()。
每个单位都应设置档案机构,以便于对本单位的会计档案进行保管。()
会计职业道德作为一种调整会计职业关系和改造会计人员品质的方式,作用面广。()
杜威的“教育即生活”的基本含义是()
TheWorldHealthorganizationis【S1】______countriestofollowsixpoliciesto【S2】______millionsoftobacco-relateddeaths.Thes
最新回复
(
0
)