首页
外语
计算机
考研
公务员
职业资格
财经
工程
司法
医学
专升本
自考
实用职业技能
登录
计算机
One of the difficulties in building an SQL-like query lange for the Web is the absence of a database schema for this huge, heter
One of the difficulties in building an SQL-like query lange for the Web is the absence of a database schema for this huge, heter
admin
2009-02-15
73
问题
One of the difficulties in building an SQL-like query lange for the Web is the absence of a database schema for this huge, heterogeneous repository of information. However, if we are interested in HTML documents only, we can construct a virtual(66)from the implicit structure of these files. Thus, at the highest level of(67), every such document is identified by its Uniform Resource Locator(URL), has a title and a text Also, Web servers provide some additional information such as the type, length, and the last modification date of a document. So, for data mining purposes, we can consider the site of all HTML documents as arelation:
Document(url,(68), text, type, length, modify)
Where all the(69)are character strings. In this framework, anindividual document is identified with a(70)in this relation. Of course, if some optional information is missing from the HTML document, the associate fields will de left blank, but this is not uncommon in any database.
选项
A、field
B、relation
C、script
D、tuple
答案
D
解析
在万维网上建立一个类似于SQL的查询语言的困难之一是缺乏一种适用于这种巨大的、异构型信息仓库的数据库模式。然而,如果仅限于HTML文档,我们就可以由这种文件的隐含结构建立一种虚拟模式。这样,在最高抽象级别,每个文档都可以由统一资源定位器(URL)来标识,有一个标题和一个文本。同时,由Web服务器了来提供某些附加的信息,例如,类型、长度和文档的最后修改日期。这样,对于数据挖掘应用来说,我们可以把所有HTML文档的集合看做一个关系:
Document (ur1,title,text,type,length,modify)
这里,所有的属性都是字符串。在这种框架下,一个单独的文档可以用这种关系的一个元组来标识。当然,如果某些任选信息在HTML文档中缺失,有关字段就留做空白,但这种情况在任何数据库中都是常见的。
转载请注明原文地址:https://www.kaotiyun.com/show/WIJZ777K
本试题收录于:
网络工程师上午基础知识考试题库软考中级分类
0
网络工程师上午基础知识考试
软考中级
相关试题推荐
某项目的网络图如下,活动D的自由浮动时间为()天。
关于大数据及应用的描述,不正确的是()。
在V模型中,(1)是对详细设计进行验证,(2)与需求分析相对应。(1)
项目进度表至少包括每项计划活动的计划开始日期与计划完成日期,常见的做法是用一种或多种格式的图形表示。在下面的图表中,常用于表示项目进度表的是()。
()向用户提供虚拟的操作系统、数据库管理系统等服务,满足用户个性化的应用部署需求。
在管理项目及投资决策过程中,需要考虑很多成本因素,比如人员的工资、项目过程中需要的物料、设备等,但是在投资决策的时候我们不需要考虑_________________,还应尽量排除它的干扰。
网络协议和设备驱动软件经常采用分层架构模式,其主要原因是()。
在下列技术中,____________提供了可靠消息传输、服务接入、协议转换、数据格式转换、基于内容的路由器等功能,能够满足大型异构企业环境的集成要求。
ThedevelopmentoftheSemanticWebproceedsinsteps,eachstepbuildingalayerontopofanother.Thepragmaticjustificationf
下面是通过showipripdatabase命令来显示RIP数据库信息,请解释下划线的部分的含义。Router#showipripdatabaseNetworkNextHo
随机试题
A.痛剧,固定不移,拒按,脉盛B.痛缓,痛处不定,喜按,脉虚C.胃脘灼痛,遇热痛甚,得寒痛剧D.胃痛遇寒则剧,得温痛减E.胀痛或涉及两肋,与情志有关
某设备在使用过程中,由于外力作用造成精度降低,同时出现了更为先进的设备,造成了该设备价值的降低,可以判断该设备遭受了()。
微型计算机的主机,不能缺少()等组件。
寄售业务中,代销人只享有对货物的控制权而不享有所有权,因此,货物售出前的风险由寄售人承担。()
某餐饮企业2014年2月份购置一台税控收款机,取得的增值税普通发票上注明价税合计金额为11.7万元,当月该餐饮企业提供餐饮服务取得营业收入120万元,其中含销售酒水收入20万元,则该餐饮企业2014年2月应纳营业税()万元。
以公开,间接方式发行股票的特点是()。
根据诉讼时效法律制度的规定,下列表述中,不正确的是()。
旅游者的义务有()。
阅读以下说明和JaVa代码,将应填入(n)处的字句写在答题纸对应栏内。【说明】任何一种程序都是为了解决问题而撰写的,解决问题时需要实现一些特定的运算法则。在策略(strategy)模式下,可以更换实现算法的部分而不留痕迹,切换整个算法,简化改为采用其他
有如下程序:#includeusingnamespacestd;classtest{private:inta;public:test(){cout<<“constructor”<
最新回复
(
0
)