欢迎来到杂志之家!发表咨询:400-888-7501 订阅咨询:400-888-7502 股权代码 102064

信息分类标准实用13篇

信息分类标准
信息分类标准篇1

1 标准化与信息化

标准是以科学、技术和经验的综合成果为基础,并以促进最大的社会效益为目标制定的一种“共识”;根据其适用范围、作用对象和性质的不同,分别有国际标准、技术标准、卫生标准等很多种类。标准化的实质是“通过制定、和实施标准,达到生产、流通的统一”,而标准化的目的则是为了“获得最佳的秩序和社会效益”[1]。

医学(或医疗)信息标准的制定和标准化的实施是实现医学信息网络化和确保信息、数据交流以及资源共享的基础。医学信息的标准化主要包括两方面的内容,一是术语的标准化,二是交换技术的标准化。医学术语的标准化,主要包括信息的分类与编码、医学术语和专用词汇的标准化;而交换技术的标准化则是对网络信息交换和流通的一种规范[2]。

由于缺乏客观、规范的标准以及临床诊疗信息的主观性特点和个性化倾向,目前的中医信息化发展整体上还相对落后于西医,尤其是很少涉及到日常的诊疗活动。因此,中医临床信息的标准化建设是实现中医临床信息化的重要前提条件[3];而信息分类则是中医信息标准化建设中一项重要的基础性工作。

2 中医临床信息分类标准的框架设计

信息分类是标准化工作的基础,是统一和交流的前提。准确地界定中医临床信息的范围并对其进行符合中医临床诊疗特点的分类是制定中医临床信息标准和中医临床信息标准化建设的一项重要的基础性工作。基于对中医临床诊疗过程和特点的分析,我们对中医的临床诊疗模式进行了归纳和概括(见图1),并在此基础上设计、制定了以理、法、方、药为中心的中医临床信息分类框架(见图2)。同时参考和借鉴现代医学的临床信息分类,将中医的临床信息重点划分为患者信息、诊察信息和治疗信息三大类。

其中患者信息主要包括4个部分:①个人基本信息,如姓名、性别、年龄等基本情况;②病情及症状,主要是患者的主诉及对症状描述;③中医特色信息,如生活、居住环境,个人生活习惯,体质等;④相关现代医学信息,如疾病史、既往史、家族史、过敏史以及现代医学的疾病诊断、相关检查结果和数据等。诊察信息主要包括望、闻、问、切和辨病、辨证分析。治疗信息则包括治疗大法、方药、针灸、按摩等药物、非药物治疗及生活指导、注意事项等内容。目前,基于上述分类的中医临床信息及相关内容的细化和完善工作正在逐渐展开。

3 讨论

中医临床信息标准化研究的主要内容是对中医临床信息、数据等进行适合于计算机处理的标准化作业。准确界定中医临床信息的范围是进行中医临床信息分类和设计、制定中医临床信息分类标准框架的前提和基础,也是本研究的重点和难点。

辨证论治是中医临床的主要特征,理、法、方、药则是辨证论治的核心内容。因此,以理、法、方、药为中心的中医临床信息分类标准框架设计基本上可以如实地反映中医的临床诊疗特点和过程。在“理、法、方、药”四大项目中,涉及“理”的部分最为关键,是全面地获取患者信息并准确地进行辨证以及确定治疗原则和选择相应方药的基础环节。由于其中既包含了四诊八纲、内外妇儿等中医诊察以及辨证、辨病等临床内容,也涉及到阴阳五行、脏腑经络、病因病机等基础理念,所以从某种程度上讲,所谓的“中医临床信息”实际上几乎涵盖了所有的中医知识和内容。此外,从目前的临床实际情况来看,中医的日常诊疗活动当中已经不可能不涉及到现代医学的内容,特别是邀请北京各大中医院院长和档案管理专家的两次咨询活动更使我们对现代医学的影响范围和程度有了进一步的了解。是否或如何将现代医学的相关临床信息融入中医的临床信息分类是本课题需要解决的另一个关键问题。

考虑到中医临床信息标准化工作的必要性和紧迫性,本研究将重点锁定在中医临床信息分类标准的制定上,基本上没有考虑现代医学的诊疗信息对中医辨证论治的直接影响。而对于所涉及到的现代医学相关诊疗内容和临床信息,将单列一个项目,并按照现代医学的术语标准加以记述。医学信息的标准化是医疗信息系统网络化发展的必然要求,构架既可充分体现中医自身的特点又可实现与世界先进水平接轨中医临床信息分类标准,则是完善中医临床信息规范,促进中医临床信息和经验的交流,实现资源共享和信息化发展的重要基础性工作。

参考文献

信息分类标准篇2

以中文雅虎(Yahoo)为例,它将网络信息分为14个宽泛的类目,每个大类又分出若干二级类,二级类目下细分出三级类目,可根据需要细分出四、五级类目。可以说,Yahoo采取的是一种逐层扩充的方法,以使知识的覆盖面越来越全。但是,从Yahoo分类每年都发生的明显变化和迅速增长的网络信息资源我们可以看到,仅仅设置这14个大类是难以涵盖人类社会生产生活的各个方面的。又如搜狐(sohu),将网络信息分为18个大类,网易(WWW.163.com)将网络信息分为19个大类,都有类似情况。总之,由于各种原因,现在的网站分类设置还不完善。知识覆盖不全,体系过于简单。几乎所有的中文搜索引擎的分类体系都存在着知识残缺不全、体系设计不完整的通病。

1.2 类目划分标准不够合理

信息资源在同一层次下划分的标准不够统一,有时出现两个或两个以上划分标准的现象。具体来讲,同一层次类目在选择上存在的问题有:一方面,网站为了突出当今的热门和主流信息,将一些下级类目提升到大类中,如大多数中文网站把“电脑网络”或“计算机与网络技术”与“科学技术”并列为大类;又如网易将“体育竞技”和“少儿乐园”放在大类中。另一方面,子类的设置的标准问题,如Yahoo的“科学”这一大类下设有“电脑与信息技术”、“活动”、“教育”、“科普”、“酷站”、“能源”、“字典”、“组织”等等的二级类目。此外,在大类的展开中常出现整体不包含局部的违反逻辑规则的现象。

1.3 各网站采用的分类标准不同,各行其是,导致了用户在使用时无所适从

以网络信息资源为基础建立类目体系,虽有较好的实用性,但类目划分的规律性不强,从而造成了各搜索引擎的分类不一致,体系也不太严密、科学,类名不规范,各个搜索引擎设立分类目录时力图突出的是自己的特色。

如新浪设立了“少儿搜索”大类,搜狐把“公司企业”单独列为一个大类,这就使得用户在使用时必须对某个搜索引擎的类目比较熟悉,否则当人工的分类有时与某些用户的习惯不一致时,会造成这些用户无法在正常的路径中找到资料。

1.4 类目名称设置不够规范合理,不能全面反映类目的内容,给用户查找易造成误解

类名有时不能确切地概括类目的内涵,有时只有象征意义。此外,由于类目的下位类范围较宽,上位类有时很难有效限定其含义,再加上网络自编分类体系一般不使用注释揭示类目内涵,容易使一些类目的含义和范围难以确定。

设置好类目名称关键是选好类日用词。很多网络分类体系中采用一些含义模糊的语词,而且没有注释,这就使用户很难判断该类目的外延。如“网易”的“另类科学”,“搜狐”的“生活情趣”等类名,如果没有注释,根本就无法明白该类的内容包括什么。

1.5 类目排列缺乏逻辑性

目前,中文网站总的来讲类目排列比较随意,外延常常有交叉重叠。几乎所有的中文搜索引擎的分类体系都存在着类目排列混乱的通病。如新浪、网易、搜狐、中华网在线等,都把“文学”与“艺术”、“电脑网络”与“科学技术”、“经济”与“文化”及“政治”等原本密切的大类,却人为地分割开来。又如网易对“文学”大类之下15个二级类目的排列,逻辑性不是很强。再如新浪对”文学”大类之下30个二级类目的排列,即便是按类目的使用频率或访问量序列排列,也使人感到排列次序不规律,不易查找。

1.6 从事网络信息分类组织的人员都大多是非专业的分类人员,缺乏专业知识

随着网络信息资源的迅速增长以及信息需求的不断加大,网站业务量也快速攀升,而建立一个优秀的中文搜索引擎是一项庞大复杂的系统工程,在技术、设备、人力、财力的投入上都有比较高的要求。因此,许多网站扩大了工作人员的招收数量和范围,与此同时,许多网站却忽视了引进有信息处理专业知识的人才,因此造成了许多诸如以上提到的网络信息分类组织方面的问题。

面对海量网络信息,其分类体系的诸多弊端为用户充分利用网络信息、开发共享网络资源带来严重困难。因此,构建规范合理的网络信息分类体系,实现网络信息分类组织标准化已是大势所趋。

2 国内有关学者的研究观点

从1998年开始,国内对网络信息分类组织的研究此起彼伏。其中,有许多学者表达了网络信息组织“标准化”的思想。如黄如花在文献1中指出要“信息描述标准化”;又如郑福根在文献2中认为网络信息组织的原则之一就是“标准化原则”;再如张林龙在文献3中指出“建立统一的网络信息分类标准成为网络信息分类组织的迫切需要”等等。此外,从近几年的研究成果来看,要编制一部适用于网络信息分类组织的分类法已具备了一定的理论基础,此说法可从刘延章、余义芳在文献4中对1998年~2002年这5年间160余篇有关网络信息分类组织研究的一些结果中略见一二。下面是文献4中的部分观点:

(1)关于网络信息、网络信息用户、网络信息技术环境特点方面的研究成果极大地提高了我们对网络信息分类检索工具的标引对象、使用对象、所处环境的认识,为编制高质量的网络信息分类法打下了认识基础。

(2)关于网络信息分类法与传统文献分类法方面的比较研究为我们借鉴二者各自的特点、编表的理论、方法和技术提供了便利,从而为编制高质量的网络信息分类法打下了理论基础。

(3)关于传统分类法应用于网络信息分类组织方面的研究虽然有助于传统分类法特别是《中图法》自身的调整和改造,使之适应于网络信息分类组织的需要,但也为更好地编制网络信息分类法打下了方法基础。

(4)关于现代技术应用于网络信息分类组织方面的研究为编制高质量的网络信息分类法奠定了坚实的技术基础。

(5)关于中文网络信息分类体系的特点、问题及其改进方面的研究对于编制高质量的网络信息分类法具有现实的借鉴意义。

(6)关于统一的中文网络信息分类法编制方面的研究对编制高质量的网络信息分类法奠定了扎实的基础。

从上述研究结果可以看出,我国编制一部高质量的网络信息分类法具备了一定的理论研究基础和技术实现条件,为实现网络信息分类组织标准化提供了强有力的保障。

3 对网络信息组织标准化的构想

通过以上分析,要实现网络信息组织标准化,编制一部适于网络信息组织的《分类法》是非常紧迫,也是切实可行的。但网络环境下的信息分类体系与传统文献分类体系相比存在着许多差异:①网络分类是以事物为中心,而不是以学科为中心列类;②网络信息分类是以网络资源为分类的基本对象,类目收录对象的范围更广;③采用了更多的信息技术;④直接采用语词进行信息标引;⑤传统分类是以线性方式展开类目,而网络分类是以网状方式进行超文本链接;⑥更新速度快。因此,编制网络信息分类法应考虑以下两大方面。

3.1 宏观构想

编制网络信息分类法,实现网络信息组织标准化,应体现以下主要原则:

(1)科学性原则。网络信息分类法应结合网络信息资源的特点,在充分揭示各学科之间内在联系和相互关系的基础上,将学科分类与事物分类相结合,构建一套科学合理的网络分类体系。

(2)继承性原则。网络信息分类法应吸收传统分类法的精华,吸收目前各中文网站分类体系的优点,结合现代信息技术来共同建造。对传统的东西不能全盘抛弃,也不能全盘吸收,应在吸收借鉴的基础上有所创新,有所发展。

(3)动态性原则。由于互联网是一个多元、开放的信息系统,因此,网络信息资源具有范围广、数量大、动态性强的特点。这就要求网络信息分类也要随着互联网内容的变化及时调整,使各种类型的网络信息资源都能在分类法中找到自己的位置。

(4)实用性原则。网络信息分类法应考虑网络环境下用户需求的特点。在类目的设置上,既要体现分类体系的相对稳定性,又要方便用户快速查询。类目数量控制在20~25个,类目层次展开至3~4级为宜。

(5)多维性原则。传统分类法以线性方式揭示文献信息内容,而网络信息分类法要尽可能全面而深入地揭示网络信息的内容和形式,多层次、多途径、全方位、多角度地进行信息揭示和描述,用超文本链接技术,变线性方式为网状方式,构建新型网络信息分类体系。

(6)开放性原则。网络信息分类体系具有相对的稳定性,但网络信息资源的开放性和动态性决定了网络分类体系也要随时增添新的内容。同时,不断吸收新思想、新技术,进一步满足和适应社会以及科技发展的需要。

3.2 微观构想

根据上述对网络信息分类法宏观构想原则,结合传统分类法和现有网络信息分类体系的研究成果,笔者针对网络信息资源中的一类资源——综合性网站的框架构建了5大板块,对其中内容相对稳定的休闲娱乐、社会科学、自然科学和综合信息四大板快设计了22个一级类目。该分类体系以主题为主要聚类标准,充分体现网络信息组织分类——主题一体化思想。具体如下:

一级类目

热门追踪板块:考研 聊天室 游戏 同学录 人物 明星 下载专区 招聘  动漫 flash......

休闲娱乐板块:新闻与媒体 娱乐与休闲 体育与健康 旅游与交通 生活与服务

社会科学板块:社会文化 哲学与宗教 政治与法律 军事与战争 经济与金融 教育与就业 人文与艺术 历史与地理

自然科学板块:自然科学 医疗与卫生 农业科学 计算机与网络 工程技术 环境科学

综合信息板块:国家与地区 参考资料 综合网站

上述各板块中,热门追踪板块内容不固定,根据网上热点话题的变化而变化,其余四个板块的内容相对稳定,即休闲娱乐板块包括5个一级类目;社会科学板块包括8个一级类目;自然科学板块包括6个一级类目;综合信息板块包括3个一级类目。

Internet是一个开放、动态的网络体系,对其分类体系的构建,实现网络信息分类组织标准化是一个逐步完善的过程。本文所探讨的分类体系也需要进一步细化和发展,相信经过不断的努力和实践,实现网络信息分类组织标准化的这一天不会太晚。

参考文献

1 黄如花.网络信息组织的发展趋势.中国图书馆学报,2003(4)

2 郑福根.网络信息组织的理论与方法探讨.现代情报,2004(6)

3 张林龙.网络环境下的信息组织.情报杂志,2003(10)

4 刘延章,余义芳.近五年来网络信息分类组织研究的现状及其展望.情报学报,2004(4)

5 王知津,肖洪.网络信息组织对传统信息组织的借鉴.图书馆工作与研究,2003(4)

6 陈树年.搜索引擎及网络信息资源的分类组织.图书情报工作,2000(4)

7 董琳.网络信息分类组织的发展趋势与标准化.图书情报知识,2004(4)

8 王本欣.网络信息资源组织研究.图书馆学研究,2004(5).

9 宋剑祥.从国外分类法看《中图法》对网络信息资源的组织.图书与情报,2004(2)

信息分类标准篇3

自从开展信息分类编码标准化工作以来,一直没有适合自身业务特点的农村社会经济统计信息分类编码标准。因而迫切需要进行农村社会经济统计信息的分类与编码,以满足各有关方面对信息资源共享的需求。如何建立起一个可供统计各部门统一使用的国家产品分类编码标准体系,以实现信息管理的标准化,最终实现信息的共享,已成为统计信息标准化工作的一项十分紧迫的任务。农村社会经济统计信息分类编码标准化是统计信息标准化工作的一个专业领域,是统计信息化过程中的一项富有挑战性的基础工作。建立一个完善的农村社会经济统计信息分类编码体系,对农村社会经济统计基础数据库建设、信息共享和各类应用系统建立都至关重要。

1统计信息分类编码概念

分类编码是指把研究对象按各自的特征、特性进行分类,并按一定的规则编排成数字码或数字、字母混合码的过程。统计指标编码就是根据统计指标分类,将统计指标赋予一定规律性的易为计算机识别和处理的一组有序符号排列。农村社会经济统计信息分类编码就是用字符(数字、字母或符号)对不同的行政级别分属不同类别的统计指标进行分类,并按照不同的类别形成特定的规则和依据。

2统计信息分类编码原则

2.1分类原则我国已经开展了大量的农村社会经济统计工作,各类统计信息内容广泛,但是还没有形成一个统一的信息化的分类与编码,现有数据的检索、处理、分析和信息服务等存在困难,不能满足当前综合指标检索、分析、处理的要求,根据农村社会经济统计信息处理的实际需要,制定如下的分类原则:①分类的结构采用层级结构,逐级展开形成完整的分类体系;②分类要包括所有主要农村社会经济统计指标类型,适合各种检索、处理需要;③分类要保持统计指标体系的相对完整;④分类要处理好指标层次与指标分组的关系,加强分类的完备性。

2.2编码原则根据国标《标准编写规则》第3部分信息分类编码(GB/T20001.3-2001),结合农村社会经济信息的特性,将信息按如下原则分类与编码。①科学性、系统性。以适合现代计算机、数据库以及应用和管理为目标,按照农村社会经济信息的属性或特征进行科学分类,形成系统的分类体系。②稳定性。分类体系以各要素最稳定的属性或特征为基础,能在较长的时间内不发生重大变化。③完整性和可扩展性。分类既要反映要素的属性,又要反映要素间的相互关系,应具有完整性。农村社会经济统计信息的分类编码工作是一项较为复杂的系统工程,要包含所有主要的农村社会经济统计指标。④规范性。分类名称尽量沿用习惯名称,有国标则遵循国标,避免概念混淆。⑤唯一性。保证1个编码对象仅赋予1个代码,1个代码只反映1个编码对象。

3农村社会经济统计信息分类与编码方法

3.1分类方法信息分类的基本方法有线分类法、面分类法、混合分类法3种。基于统计信息的特性,农村社会经济统计信息分类采用线分类法(也称层次分类法),是将初始的分类对象按所选定的若干个属性或特征,逐次地分成相应的若干个层次的类目,并排成一个有层次的、逐级展开的分类体系。线分类法层次性好,能比较好地反映类目之间的逻辑关系,实用方便,既符合手工处理信息的传统习惯,也方便计算机的运行处理。

3.2分类设计根据信息分类原则,结合《全国主要产品分类与代码》(GB/T7635-2002)、行政级别分类、《国民经济行业分类》(GB/T4754-2002)A门类以及农业生产结构特点,将农村社会经济统计信息分成5个等级:5个行政级别类,5个大类,10个中类,70个小类,900个细类。在数据库结构设计中,每一层都留有足够的空间用于类别的扩充。

行政级别类:是按照行政区划级别进行划分,依次为省级、市级、县级、乡级、村级。

大类:是依照国民经济行业分类原则而建立的类别,依次分为种植业、林业、畜牧业、渔业和其他农林牧渔业产品。

中类:是大类中按照生物学科和农业学科基于生产实践中种养的植物、动物划分成若干分支的类群,如种植业下分粮食作物、蔬菜等。

小类:是中类按照生物学科和农业学科分类法细分成若干分支的类群,如果粮食作物下的小类可划分为谷物、豆类、薯类、油料等。

细类:是小类中细分的基本单位,也是各级单位的起点,即物种(简称“种”),如具有北方特色的谷物主要有玉米、谷子、高粱等等。

3.3编码规则编码规则是分类编码体系的具体表现形式,它是根据统计数据的各种属性特征来规定编码的每一位取值和对应的含义,进而约束代码的制定。编码要反映出其对应统计数据的属性和主要特征,以区分不同统计信息的类别。

4分类编码实例

农村社会经济统计信息编码设计首先确定编码对象。例如编码A01的对象是种植业下的粮食作物。其次建立编码、分层和各码位的规范取值规则,对每一编码对象制定码长。农村社会经济统计信息分类采用9位编码,分6个层次。第1层用英文字母z表示指标标识,第2层用数字1~5表示,第3层用英文字母表示,与GB/T4754—2002A门类中大类的代码相对应,余下3层用数字01~99表示。第3层的代码从A~E,其余3层代码从“01”编至“99”,各码位代表相应的类别。每一层的编码采用数字顺序编码,动态递增产生系列顺序代码号,随着编码的增加而产生新的信息类别代码。其代码结构见图1。

如Z1A010101(稻谷)的结构为:z为指标标识,1为省级指标,为种植业,0l为粮食作物,01为谷物;01为稻谷。最后编制类别代码表(后4层),对每一编码对象按既定的编码规则编制出该编码的数据元素的所有取值表(表1)。

信息分类标准篇4

0引言

随着信息化的发展,信息管理在项目管理中越来越重要,不同种类、不同数据格式信息的交流已经成为工程项目管理的一项关键工作。

工程项目规模大、周期长,在管理过程中需要处理大量的信息。如果缺乏统一标准,信息格式各异,必然给信息交换、资源共享带来不便。因此,应建立科学、合理的信息标准,对这些信息进行分类、存储、综合利用。如果是对大型工程项目或多个工程项目进行管理,这一点尤为重要。

工程项目是一个复杂的系统工程,是由多个参与方协同工作完成的。信息资源共享是各方协同工作的前提,信息资源共享要通过信息系统集成实现,而信息系统集成的实现依赖于信息标准化。可见信息标准化是信息系统集成和信息共享的前提,关系到工程项目能否高效率的完成。

1 工程项目管理信息标准化

1.1 工程项目管理信息

在工程项目的实施过程中,要管理产生的各种各样的信息,包括:(1)结构化的数据文件,这类信息可存储在数据库或特定的应用软件中,例如工作分解结构WBS、成本费率、进度计划、人力资源信息、财务会计信息;(2)非结构化的文本信息文件,例如合同、技术规范、变更令、施工报告、会议记录;(3)非结构化的图形文件,例如各种2D和3D的图纸;(4)非结构化的多媒体文件,例如各种图片、声音、影像文件。

1.2 工程项目管理信息标准化

工程项目管理信息标准化包括三方面的内容:信息格式标准化、信息传递标准化和信息管理标准化。

(1)信息格式标准化。信息标准化是信息化的基础,而信息格式的标准化则是信息标准化的基础,也是工程项目各参与方进行信息共享、综合利用的前提。要实现工程项目信息格式的标准化,就要对工程项目管理中的信息进行统一分类编码。对于结构化的数据,要定义标准的数据元素编码,即数据标准;对于非结构化的文件、图纸等信息,则必须规定标准的分类编码格式。

信息分类编码的方法有很多种,如人流分类编码、物流分类编码和信息流分类编码等。人流分类编码适用于工程项目人力资源管理的信息编码;物流分类编码适用于工程项目物资采购管理,工程项目信息分类编码中最常用的是信息流分类编码。

需要特别指出的是,必须为每组编码涉及的信息建立标准索引,如项目编码索引(这对于多项目的管理尤其重要)、组织编码索引、专业编码索引等,而且必须保证索引的一致性,随着工程项目的进展及时更新。

(2)信息传递标准化。在建立了标准化的信息格式后,对工程项目产生的信息,必须规定标准的传递程序,使项目信息能够准确、高效的在各个参与方之间进行传递、交流,保证信息的资源共享和项目的高效完成。从信息的产生,到不同接收组织或个人间的流转,直到信息存储的整个信息传递路径,构成了标准化的信息传递程序。对工程项目实施各个阶段产生的信息,都要建立标准化的信息传递程序。

(3)信息管理标准化。在建立了标准化的信息格式和传递流程后,必须严格按照规定执行,加强对工程项目信息的标准化管理。首先,应充分认识到标准化的信息管理在整个工程项目建设中的重要意义,在工程项目建设初期就应该设立信息管理的专职部门,负责项目信息标准的统一规划,制定项目文件信息管理程序,建立规范的信息控制与文件管理体系,同时由专人负责进行不同信息的收集、整理、分析、利用。其次,应该加强项目信息标准化管理的监督,通过项目信息管理制度保证信息标准格式、信息标准程序的严格执行,从而促进整体项目管理的标准化、程序化、规范化。为了提高工程项目信息管理的标准化程度,应对工程项目的信息进行分类管理。参照Mc-GrawHill Construction公司的项目管理手册,工程项目的信息可以按照如下方法分类:

项目信息:所有与项目有关的信息都在项目信息中归档管理,负责该项目的项目经理应该编制的项目信息包括进度信息、费用信息、质量信息、往来信函、图纸、合同、变更令等。

核心信息: 从项目信息中划分出职能部门和项目的核心信息,指派专门人员进行管理,定期将核心信息文件归档保存。

受控信息:工程项目各参与方敏感的任何信息都应该视为受控信息,对其查阅、复制等操作应受到权限级别的严格限制。

2 工程项目管理信息系统

信息分类标准篇5

随着互联网技术的迅猛发展,Web2.0以应用的开放性、信息传播的交互性、读写并存的表达方式、社会化的联合方式和便捷化的体验方式,使得越来越多的网民参与到互联网信息的创造及中。然而,随着信息量的快速增长,由此衍生的信息杂乱无章、信息的纯净度和可信度大大降低、搜索引擎精准度下降等问题相继出现在互联网用户面前,网民越来越期待及时准确地获得切合自身需求的信息和知识,以及便捷的互动交流和信息的协同共享。面对这一问题,网络模式急需更新换代,能够为用户提供一种更加高效、精确和个性化的互联网平台的Web3.0模式成为首选的解决方案。

1 Web3.0及其特征

Web3.0是新一代互联网应用的统称,它是建立在Web2.0的基础上,包含了Web2.0的所有特点,但同时为了让人们更好地利用网络资源,Web3.0提供了一种方便管理、方便查找信息资料,能够自己控制一切的全新的服务:网站内的信息可以直接和其他网站相关信息进行交互,能够对多家网站的信息进行整合使用,并能根据用户需求,智能化处理互联网海量信息的整合,最终聚合用户个性化的需求,同时实现真正意义上的互联互通。总之,相对于Web1.0的“浏览和下载”、Web2.0的“参与、展示和互动”,Web3.0的核心理念是“个性、精准和智能”。其主要特征表现如下:

1.1个性化信息聚合

Web3.0最大的特点在于信息的聚合以及提供个性化的信息服务,真正的Web3.0时代不仅仅是按照用户需求提供综合化服务,创建综合化服务平台,更关键的是,把散布在互联网上的各种信息点以及用户的需求点聚合和对接起来,提供基于用户偏好的个性化聚合服务。

1.2信息检索的高精准度

Web3.0在对于UGC(用户生产内容)筛选性过滤的基础上同时引入偏好信息处理与个性化引擎技术,对用户的行为特征进行分析,既寻找可信度高的UGC源,同时对互联网用户的搜索习惯进行整理、挖掘,得出最佳的设计方案,帮助互联网用户快速、准确地搜索到自己想要感兴趣的信息内容,避免了大量信息带来的搜索疲劳。

1.3搜索引擎的智能化

Web3.0时代的网络是智能网络,这是一个以整个互联网为基础,聚合了所有知识的智能平台。在这样的平台上,用户可用自然语言表达自己的查询意图,搜索引擎能够对查询进行解析,提取相关概念,组合查询表达式,从而返回准确的结果;甚至,用户可以提出完整的问题,通过搜索获得一些问题的解决方案。

1.4多种终端平台、跨网站和跨语言信息交互

Web3.0不仅能够实现不同网站间的信息交互,而且还能实现不同终端的兼容。通过互联网与通信的融合,用户可以用所有智能终端(固定电话、移动电话、PC、IPTV以及其他智能终端)轻松享受看得见、听得到、用得好、即时交互的信息服务。另外,Web3.0的智能翻译引擎突破了国家、语言的限制,使用户用自己的母语可以与全世界所有人进行交流,实现了更大范围内的信息交流与共享。

2 分众分类及其特征

分众分类(Folksonomy)是随着Web2.0而产生的新型网络信息分类法,也叫大众分类、社会分类、自由分类等,它就是由网络信息用户自发地为某类信息定义一组标签(Tag)进行描述,并最终根据标签被使用的频次选用高频标签作为该类信息类名的一种为网络信息分类的方法。其实质就是以词为类,但其类目却是平面的、非等级的,它是用户用标签对感兴趣的资料进行分类,并与他人共享标签的过程和结果。

2.1分众分类的优势

与传统网络信息分类方法相比,分众分类最大的不同之处在于,它并不采用严格的分类标准,其分类全部由用户直接提交,分类的形成过程完全是自发的。分众分类的主要机制基于“开放性元数据标准”和“自然语言社群聚类”。其优势主要表现在:首先,分众分类的标签形成过程充分体现了其自由性,任何用户都可以自由选择自然语言语词来对感兴趣的资源进行标注,从而可以从多个维度来揭示信息内容;其次,分众分类具备实时性与适应性,用户可以随时对其阅读或创建的内容和主题创建标签,并立即保存下来,并被允许即时快速的进行标签用语的修改;第三,分众分类为用户提供了共享标签的功能,任何人对内容进行标注后,他人可立刻看到这些标签,也可以点击这些标签,进而看到更多使用这个标签的信息内容,或是与此相近的内容。

2.2分众分类的局限

作为使用非控词汇的分众分类目前还存在一定的局限性,具体表现如下:

2.2.1标签的多样性 由于用户认知程度不同,对同一事物的揭示程度也存在很大的差异,导致不同用户在标注同一信息时使用了不同的标签,但是系统却无法创建这些标签之间的联系。标签的多样性极大的影响系统的检全率。

2.2.2标签的模糊性 分众分类是一种基于标签语法层次的简单聚合分类,因此,同一标签可能映射出不同语义的资源,而系统却不能识别出各个语义的不同。标签的模糊性使用户不得不花更多的时间和精力找到与检索标签相关的记录,因而影响到系统的检准率。

2.2.3标签的扁平化组织 分众分类的组织方式与传统的等级体系分类法组织方式不同,它是扁平化的,没有等级层次的划分。因此,系统无法识别各个标签之间的等级层次联系。一方面,这种由于标签缺乏等级控制造成的信息分散也必然影响了信息的检全率;另一方面,类目的平面非等级显示同样会隐藏一些有价值的信息。同时,信息越多利用标签直接找到相关信息就越困难。

2.2.4系统间的交互性很低 很多网络系统都具有标注资源和分享标签的能力,但是目前各个分众分类系统在语义表达和格式规范上并不一致,这不仅阻碍了各个系统之间的信息交互和软件的自动化处理,同时也引发了一系列检索方面的问题。另外,受语言、文化背景等因素的影响,跨国界、跨文化的分众分类系统之间的交互性更低。

2.2.5标签问语义关系缺乏 分众分类是以高频标签作为类目的一种信息分类方法,其分类结构是平面的,标签间是平等关系,缺乏对标签间的层次体系关系、属性关系和其他的复杂语义关系的描述,而标签间语义关系的缺乏不仅影响到检索的精准度,更重要的是对智能化搜索带来诸多障碍。

3 Web3.0对分众分类的需求

Web3.0的基础是Web2.0,因而,分众分类也是Web3.0的一种主要的信息组织方式。但是目前分众分类所具有的上述局限性显然阻碍了Web3.0的核心理念――“精准、个性和智能”的真正实现,Web3.0的发展需求决定了分众分类的发展方向,因而,未来的分众分类还需要在以下几个方面进一步拓展。

3.1微内容的自由整合与过滤研究

微内容是Web3.0的基本信息单元,由于Web3.0同样具有草根性,其内容良莠不齐,有价值的专业分析讨论与各种杂谈闲聊掺杂在一起,因而首先需要对微内容进行筛选性的过滤研究。这部分的研究主要包括:研究分析用户的行为特征,寻找可信度高的微内容源;对微内容的价值进行判定,并按价值量的高低作不同处理;对垃圾信息进行有效过滤等等;其次,研究如何应用Mashup技术对用户生成的微内容进行整合,如何利用ONTO/RSS基础聚合技术对微内容进行有效聚合,从而使信息的特征性更加明显,为实现Web3.0的“个性化”打下基础。

3.2微内容的标准化与结构化研究

要实现Web3.0的跨平台、跨社区、跨语言的信息共享,需要对微内容进行标准化与结构化研究,提出一个通用的数据标准。这方面的研究主要包括微内容的拆分标准、属性选择、结构化表征、数据逻辑结构标准以及数据的存储结构标准等,其目的是使微信息之间实现互动,让Web完全可编程,从而满足复杂程序的需求,为信息在不同的应用平台之间的整合和传播提供支撑。目前,有关微内容的标准化和结构化的研究则仅限于企业网站的构建,如红门资讯在微内容的拆分、词义标准化和结构化等方面进行了深入的研究,其推出的公用信息平台已经实现了厂家信息、商家信息、品牌信息、文章信息等160多类信息平台间的自由互动。但目前整个IT行业中并没有一套完善的有关微内容的拆分、属性选择、结构化表示等方面的标准,这对实现整个互联网信息的无缝连接带来障碍。

3.3标注的规范控制研究

Web3.0核心理念之一是“精准”,而因为网络用户标注行为缺乏控制,导致标签的多样性、模糊性和随意性等缺点,进而影响到检索的精准度,因而需要对用户的标注行为进行规范性控制。主要研究包括:如何利用受控词表等对同义词、近义词、专有名词等进行限定,并构建规范的标引词库推荐用户使用;如何确定标签的含义以及标签间的关联,以帮助用户在创建标签时进行选择;如何利用后控手段对不断产生的大量标签进行筛选、融合和规范化处理,并将其与核心标签关联等等。其目的避免网络用户生产出各种错误的、无意义的、不规则的标签,从而提高标签系统的准确性、兼容性和开放性,以实现标签集合的移植与共享,促进不同网络信息系统对信息资源的协同组织。目前,国内外学者都对标签的规范控制研究显示出极大的兴趣,纷纷提出了多种规范标注行为,从而提高标签质量的解决措施,如有些网站在用户标注时提供一些规范词供用户选择,或对用户的标注结果进行词义转换等,但总的来说研究的系统性不够,其深度和广度都有待加深与拓宽,从而提高检索的“精准度”。

3.4标签的基本属性研究

标签是分众分类形成和使用的基础,也是分众分类类目体系的基本构成单元。标签指代并标示Web3.0环境中的各种微内容,通过查找标签能够检索到关联的微内容。因而,标签本身的相关属性决着信息检索的质量和效率,所以,需要对标签的特征、标签的价值判定(包括垃圾标签的处理)、标签使用量的分布规律、标签的赋予权、标签的翻译、标签库的构建等展开进一步的研究;同时,因为目前的标签比较侧重于横向关系的表达,而专业性、学术性信息的表达则需要纵向和横向两个方面的参照系,因而,如何加强纵向关系的表达,仍然有待于进一步研究。目前,对标签的特征、标签价值判定的相关研究比较多,而对标签使用量的分布规律、标签的赋予权、标签的翻译、标签库的构建等方面的研究相对较少。

3.5传统分类法与大众分类法的融合研究

分众分类是由网络用户的自发标引行为产生,尽管这在一定程度上体现了用户对知识分类的共性,但由于不同使用目的对信息的类分会使得相同的信息被划分在不同的类别中。这种平面胜的分类体系,既无法准确地表达出相关标签的层次,也难揭示出信息之间复杂的关系;另外,受大众浅层信息需求的误导,很多有价值的信息也容易被淹没。因而,分众分类的质量无法满足Web3.0检索精准度的需求。而传统分类法特别是文献分类法历史悠久,在一定程度上体现了知识分类的科学性。为此,应该将分众分类与传统分类法进行融合,以提高信息分类的质量和效率,如可先对选定范围内全部信息划分大类的基础上允许网络用户再进行知识细分。把众多的标签先按人为大类存放,既增强了标引一致性,又降低了平面非等级结构的标签所带来的检索难度。

3.6标签的聚类研究

由于分众分类允许用户使用不同的标签来标记相似的资源,但并不了解这些标签之间的关系,因而其内容检索机制受到严重的阻碍。为克服这一局限,有必要针对标签的统计学规律、标签间的共现分析、层次分析、标签与特定人和物的相关度、标签间的相似度比较等问题进行聚类分析,其目的是寻找相关标签群,从而形成立体的分类体系,并在此基础上展开标签关系库的构建研究。显然,这部分的研究有助于实现Web3.0的“精准”和“个性化信息聚合”。

3.7标签间的关联研究

Web3.0的特征之一是要让用户跨越不同的应用平台,并共享不同社区的信息资源,而这种信息的共享除了需要相关内容的标准化、结构化和规范化研究外,更重要的是通过标签的方式进行相互链接,现有的标签只能做到对站内的关键词进行关联,不同网站之间站信息没有形成真正的网络和关联,往往存在信息“孤岛”,常常要借助其他的搜索引擎,因而未来的研究应该着重予标签间关联的深化研究。一方面,研究同一网站中同一文本和不同文本间的所有标签之间的自动链接技术;另一方面,研究不同网站间标签的关联,从而在更大范围、更高层次上建立起词间关系网络,为实现Web3.0的“跨平台”信息交互打下基础。

3.8标签与本体的结合研究

本体是在语义网环境下为解决语义歧义、实现信息智能处理而提出的一种形式化描述的、共享的概念认知模型,它是对某一领域知识的规范化描述,不仅提供了概念明确的定义,而且揭示了概念问丰富的语义关系,使知识能够在人与人之间、人和系统之间以及各种异构系统之间进行广泛的共享和交流。显然,本体所具备的特性正好弥补了分众分类的许多不足,因而,需要充分挖掘标签间的语义关系,将标签与本体进行结合研究。具体研究包括:分析分众分类中用户、网络资源和标签三者之间的同现关系,对分众分类中的各种标签进行语义分析,研究标签之间的主题相关性,并给出这些标签间相互关系的明确定义,同时探讨如何基于标签的语义关系构建被标注对象之间的联系,并在标签中建立起概念层次,构建大众标注中各类标签词的本体,从而构成语义Web的基础,真正实现web3.0的“智能化”。目前,这方面的研究多集中在标签语义的提取、标签本体的构建等方面,并推出了多种语义标注平台。但是目前在大多数语义标注的过程中仍需要大量人工的辅助,标注平台的可用性、互用性、重用性和扩展性较差,需要进一步提高。

信息分类标准篇6

1我国中医药信息标准化工作进展

1.1中医药术语标准化工作

术语是专业领域中概念的语言指称(GB/T10112―1999《术语工作:原则与方法》)。中医药术语标准是中医药信息化建设的基础,只有在统一概念和术语的基础上,才能实现信息的规范化表达和有效传播,进而实现信息的深度共享和综合利用。为此,我国中医界研制了一系列术语标准,包括全国科学技术名词审定委员会2005出版《中医药学名词》、世界中医药学会联合会2007年出版《中医基本名词术语中英对照国际标准》,以及的国家标准(GB/T20348―2006《中医基础理论术语》、GB/T16751.1―1997《中医临床诊疗术语・疾病部分》、GB/T16751.2―1997《中医临床诊疗术语・证候部分》、GB/T16751.3―1997《中医临床诊疗术语・治法部分》、GB/T12346―2006《腧穴名称与定位》、GB/T13734―2008《耳穴名称与定位》)。近年来,术语规范研究主要集中在中药类术语[3-5]、中医证候类术语[6]、症状体征类术语[7-8]等方面。“十一五”课题“中医疾病分类代码等基础标准示范研究”(2006BAI21B03)术语规范化研究包括:《针灸学通用术语》《中医临床诊疗术语・症状部分》《中药学术语》《中医内科学术语》《方剂名词术语》《中医诊法术语》《脏腑病机基本术语标准》《中医外科学基本术语》等[9]。另外,该领域还出现了分类代码标准、主题词表和结构化术语集等信息资源,它们一般也可归入术语标准的范畴,下面分别进行介绍。

1.1.1分类代码标准分类代码标准通过赋予代码方式规定了一系列类别或范畴,用于对领域对象进行合理分类,从而优化领域信息组织、检索和交换。这方面有国家标准GB/T15657―1995《中医病证分类与代码》、国家军队标准GJB791.22―1990《全军后勤物资分类与代码・中药类》、卫生行业标准WS/T118―1999《全国主要产品分类与代码第1部分:可运输产品(中药部分)》。并开展了《中医内科信息分类与代码》《中医针灸信息分类与代码》《中医骨伤推拿信息分类与代码》等标准的研究工作[10]。近几年了5个中药编码相关的标准,其中2项地方标准由上海市质量技术监督局:DB31/T703―2013《小包装中药饮片包装剂量规格与色标》、DB31/T826―2014《中药饮片包装编码与条码表示》。3项国家标准2015年新,实施时间均为2015年12月1日:GB/T31773―2015《中药方剂编码规则及编码》、GB/T31774―2015《中药编码规则及编码》、GB/T31775―2015《中药在供应链管理中的编码与表示》。

1.1.2主题词表主题词表,又称叙词表、检索表或词库,是一些规范化、有组织、体现主题内容、已定义的名词术语集合体。作为文献与情报检索中用以标引主题的一种检索工具。在医学领域,由美国国立医学图书馆编制的《医学主题词表》(MeSH)已被国际广泛采用[11]。《中文医学主题词表》(CMeSH)[12]是中国医学科学院医学信息研究所出版的MeSH中文版,用于中文医学文献的标引、编目和检索。但MeSH与中医相关的词条只有“气”“阴阳”“经络”等几条,被归入“传统医学”之下的“中国传统医学”,这显然不能满足中医文献标引的需求。

中国中医科学院中医药信息研究所(IITCM)编辑出版了《中国中医药学主题词表》[13]及与之配套的标引手册,以与MeSH兼容为原则,成为全球范围内医学界进行中医药文献标引的依据。该词表于1987年正式出版,1996年出第2版,2008年出第3版,2015年12月网络版。该词表具有编制技术先进、词表体系结构科学、词语标准规范、收词完备、一表多用、实用性强、与国际权威医学词表MeSH兼容等特点,在促进中医药学词语标准化和中医药学数据库建设的标准化上发挥着巨大的作用[14]。网络版《中国中医药学主题词表》基于词表编制原则,根据词频统计和数据库检索结果,确定需要新增、删除、修改主题词[15-17],目前收录主题词8437条,入口词13966条。

此外,1987年出版的《中医药主题词表》[18]更多考虑了中医学科特点,与MeSH有较大距离,有研究者认为使用该词表在一定程度上增加国际交流困难[19]。

1.1.3结构化术语集在信息科学领域,本体是一种特殊类型的术语集,具有结构化的特点,且更加适合于在计算机系统中使用。近年来,本体技术以其强大的知识表达和推理能力在医学领域中得到了广泛应用。如“统一医学语言系统(UnifiedMedicalLanguageSystem,UMLS)”是由美国国立医学图书馆(NLM)开发的一套医学语言系统,它实现了一系列知识组织系统的整合与传播,覆盖范围相当广泛[20]。

从2002年开始,IITCM借鉴UMLS的成功经验,以本体论方法为指导,研制了“中医药学语言系统(TCMLS)”,对中医药学的名词术语进行了系统梳理,构建了中医药概念术语的层次结构和复杂语义网络[21]。TCMLS已收录约12万个概念、30万个术语及127万条语义关系[22],并建立了基于中医药学语言系统文献检索平台[23]。在应用上,于氏等[24]采用“简单知识组织系统(SKOS)”技术规范,将中医药学语言系统转换为可在万维网上的SKOS本体,为各种语义网应用程序提供概念、术语和知识服务。

“中医临床术语系统”是一个专门面向中医临床的大型术语系统,已收录11万多条概念词、27万多个术语,内容覆盖中医物质、临床所见、病证、操作、治则治法和中药等中医临床知识各个领域[25]。该系统有望成为中医临床信息化建设的基础,在中医临床实践、理论研究和新药发现中发挥重要作用。为促进系统完善,目前研究围绕在改进系统措施、系统顶层概念分类框架等问题上[26-27]。

“中医古籍语言系统”[28]在“中医药学语言系统”基础上构建,将古籍术语分11类:阴阳、五行、藏象、疾病、诊断、治疗、本草、方剂针灸、医疗器具、摄生和相关知识,大体上可以包含古籍中涉及的概念知识点。使用和调整“中医药学语言系统”中77语义类型,增加2个语义类型“症状或体征”“疗法”[29]。目前收录概念3843个、关系术语26149个。

“传统针灸知识体系语义网络”[30]对针灸知识进行梳理,将针灸知识本体分为8个大类:刺灸、形体官窍、治疗、病候、经络、脏腑气血津液、腧穴、针灸用具。目前收录概念术语939条、语义关系16个。这些系统验证了本体技术在中医药领域的适用性,为新的技术路径在中医药术语规范化领域的应用进行了有益探索。

1.2中医药数据标准化工作

中医药行业数据库建设起源于20世纪80年代,已建设了近百个规模不同的中医药数据库,初步实现了中医药信息数字化[31]。然而,这些数据资源在数据结构、数据编码和数据语义等方面仍存在着巨大差异,不利于数据在组织之间的共享。为加强数据建设的顶层设计,实现中医药数据资源的有效整合,迫切需要构建中医药数据标准体系,实现中医药数据资源的标准化。数据标准化是按照预定规程对共享数据实施规范化管理的过程,其相关标准包括数据集分类与编码标准、元数据标准和数据元标准等[32]。1.2.1数据集分类与编码标准数据集分类与编码标准,规定了对特定领域中的数据集进行分类和编码时要遵循的原则与方法,对数据集的分类管理及数据分类导航具有重要意义[33]。陈氏[34]研制了中医药科学数据集分类与编码标准,采用面分类法将中医药数据集分为中医药事业、中医、中药、针灸及古籍5大类,并在每个“面”下,应用线分类法分成若干层级的类目,形成了一个有层次的、逐级展开的分类体系。该标准能支持中医药科学数据集的制作、管理、查找和共享等目的。范氏等[35]以相关标准和分类方法作为参考依据,提出了一套中医药数据资源的分类标准,编写了《中医药学数据资源手册》(第1稿)。该分类方案基本涵盖了所有中医药数据资源,为中医药数据资源的调查与规划,以及数据集的组织、整合、汇交、和目录查询,提供了系统、规范、实用的分类和编目办法。

1.2.2元数据标准元数据(metadata)是“定义和描述其他数据的数据”(GB/T18391.1―2009《信息技术元数据注册系统(MDR)第1部分:框架》)。元数据以数据集作为描述对象,描述数据集的外部信息。元数据标准为各种形态的数据资源提供规范和统一的描述方法,在数据资源的管理与利用中发挥着日益重要的作用。目前,在国际上应用最广、影响最大的元数据标准被称为都柏林核心元数据元素集(DC)[36],它定义了一组最为核心的术语,通用性强,可用于描述各种资源。我国2010年修改采用ISO标准等资料,了中国国家标准GB/T25100―2010《信息与文献都柏林核心元数据元素集》。林氏等研制《中医数据集元数据规范》,它是在DC、科技部《科学数据共享元数据》及《医药卫生科学数据共享元数据标准》基础上制定的一套元数据标准,能基本覆盖中医学数据集的共性元数据[32]。谷氏[37]对中医古籍数据标准化开展研究时,进行了中医古籍元数据研究。

1.2.3数据元标准数据元(dataelement)是用一组属性描述其定义、标识、表示和允许值的数据单元(GB/T18391.1―2009)。数据元标准为数据交换提供了在“数据”层面上统一且可共同遵守的数据交换规范[33]。我国在完成健康档案和电子病历基本框架与数据标准研制的基础上,通过提取公用数据元,初步形成了卫生信息数据字典。2009年12月25日启用“国家卫生数据字典与元数据管理系统(试用)”(chiss.org.cn)。2012年,卫生部通知的《电子病历基本数据集(征求意见稿)》中包括了“中药处方子集”“中医住院病案首页子集”等面向中医的数据元子集,适用于指导和规范中医电子病历基本信息采集、存储、共享及信息系统的开发。中医专家已开始借鉴相关行业的数据元标准,遵循WS/T303―2009《卫生信息数据元标准化规则》、WS363―2011《卫生信息数据元目录》等卫生行业标准,研究中医药数据元的提取规则与分类方法,从各种中医药数据库、住院病案中提取数据元,从而构建面向中医药领域的数据元目录[32,38]。

2国际中医药信息标准化工作进展

目前,中医药在世界各地迅速普及,为提升中医药在国际市场上的竞争力,促进中医药知识资源在国际间的传播和共享,需要进一步加强中医药国际标准的研制工作。近年来,我国中医界积极参与ISO和WHO的工作,取得了一系列突破性成果。

2.1国际标准化组织的相关工作

ISO是世界上最大的国际标准研制机构,已19000多项国际标准,覆盖各个技术和制造领域,大大促进了经济和技术的发展。

在我国中医界倡议下,ISO于2009年成立了面向中医药领域技术委员会(TC),暂定名为“TraditionalChineseMedicine”,缩写为“ISO/TC249TCM”,秘书处设在中国[39]。ISO/TC249工作范围是研究制定与贸易相关的中医药技术、信息、术语、服务、专用产品设备等相关标准[40]。ISO/TC249成立工作组WG5“InformaticsofTCM”,开展中医药信息学领域标准研发工作。中国中医科学院中医药信息研究所于2011年向ISO/TC249提交了“中医临床术语系统分类结构”国际标准项目提案[41],2013年7月启动立项投票并获通过,2014年10月通过委员会草案(CD)投票,目前在询问阶段标准号与名称为“ISO/DIS19465:TraditionalChineseMedicine-CategoriesofTCMClinicalTerminologicalSystem”,该标准是表示一个基于中医临床术语的核心分类框架,可帮助构建稳固的逻辑化的中医临床术语系统。

ISO健康信息学技术委员会(TC215),旨在研制健康信息领域及健康信息与通讯技术领域的标准。ISO/TC215于2009年4月正式设立了传统医学任务组(TMTF),其主要工作任务是:①确定传统医学(TM)的标准需求;②提出新的传统医学工作提案;③审阅新的工作提案以判断哪部分内容可以融入传统医学的需求[41]。我国2008年成为ISO/TC215正式成员(P成员国)后,向其提交了一系列标准项目提案。2014和2015年正式3项技术规范:①ISO/TS19738:2014Healthinformatics-semanticnetworkframeworkoftraditionalChineselanguagesystem(中医药语言系统语义网络框架),该技术规范为中医药学术语信息系统和本体创建提供了语义标准;②ISO/TS17948:2014Healthinformatics-TraditionalChinesemedicineliteraturemetadata(中医药文献元数据),该技术规范为中医药学文献资源提供了一套通用的描述元素;③ISO/TS16277-1:2015HealthInformatics-ProfilingFrameworkandClassificationforTraditionalMedicineinformaticsstandardsdevelopment-Part1TraditionalChinese,JapaneseandKoreanmedicine(健康信息学-传统医学信息标准开发的描述框架和分类方法-第1部分),该技术规范提出一套传统信息标准体系的三维描述框架,实现信息标准开发与管理的顶层设计。2.2世界卫生组织的相关工作

近年来,WHO对传统医学标准化工作高度关注,加大了相关国际合作的支持力度,并成立了西太区办事处,专门开展了有关传统医学标准化的多项工作,包括术语标准、针灸穴位标准,以及循证传统医学临床指南等[40]。自2005年由WHO西太区办事处倡导首次传统医学信息标准化非正式咨询会议,以中国、日本、韩国等为主要代表的多国研究人员及其政府对此项工作相当重视,并积极行动,推动了有关传统医学信息标准化工作的国际合作[42]。

WHO于2010年宣布启动“传统医学国际分类(ICTM)”这一项目,旨在实现传统医学术语和分类体系的规范化,为诊断和治疗等活动提供一个用语规范的传统医学知识库[43]。中、日、韩等国专家参与了ICTM项目。ICTM将首先考虑中医药领域的标准化问题,这有利于中医药学在全球范围内的推广和整合。另外,WHO拟在《国际疾病分类(ICD)》的新版本ICD-11中加入中医药等传统医学的相关内容,中国于2010年提出了ICD-11传统医学部分的推荐方案,强调了将中医药学纳入ICD-11的内容结构和技术框架[44]。正在修订的ICD-11中加入中医药等传统医学的相关内容,目前已进入草案审核阶段。这些工作都将为传统医学的发展和其国际空间的拓展创造良好条件。

3存在的问题和建议

综上所述,中医药信息标准化工作在21世纪初取得了快速发展,初步建立了中医药名词术语的标准体系,在WHO和ISO等国际标准化组织的工作中取得了一系列突破。然而,在中医药领域,信息标准的研制仍滞后于信息化建设。许多方面仍缺乏公认的标准,影响和阻碍了组织间的相互协作和资源整合。信息标准化已成为制约整个信息化工作开展的关键瓶颈。各类标准化工作的进展也不平衡,如术语标准化工作开展较早且已取得突破,但中医药数据标准不多,信息系统和仪器方面的标准化工作则基本上是个空白。“数据孤岛”现象已成为困扰中医药信息化事业发展的老大难问题,其中一个重要原因是缺乏一套行之有效的数据标准。数据标准化领域虽已开展了一些研究工作,出台了一些标准草案,但大都不够成熟,尚处于研制中。因此,今后有必要加强中医药数据标准的研制、和推广等工作,规范数据库建设行为,推进数据资源的共享和利用。

与西医及其他领域相比,目前中医药领域的信息标准化工作仍相对滞后。如截止到2015年10月27日,ISO/TC215已正式出版150个国际健康信息标准,其中其中只有3项针对传统医学的信息标准。我国中医界在国际标准化方面起步较晚,在国际标准化组织中参与的工作相对较少。但出于中医药国际推广的需要,我国在传统医学国际标准化工作方面应与时俱进。为此,需要组建一支中医药信息国际标准研制的专业队伍,积极参与国际标准化组织的活动,深入理解国际标准制定的规则,推进中医药信息国际标准的研制工作。

目前,中医药信息标准化工作仍缺乏一个顶层设计,各标准化组织之间缺乏协调,这将导致标准之间缺乏兼容性,难以配合使用。中医团体需要对中医药信息标准化工作做一番统筹规划,建立标准体系框架,并在行业内达成共识。可通过“自上而下”管理驱动的方法建立信息标准体系框架,以及“自下而上”业务驱动的方法建立中医临床信息概念模型;基于中医临床特征信息元素的值域,分析中医临床信息标准的需求,从而构建中医临床信息标准体系表[45]。在标准体系框架的基础上,各组织可加强交流,进行合理分工,明确各自的目标,以达成信息标准化工作的协调发展。

信息分类标准篇7

1 信息与文献标准化的发展现状与形势分析

1.1 现状

1.1.1 成绩 全国信息与文献标准化技术委员会(以下简称技术委员会)于1979年成立。作为一个基础性的标准化工作组织,全国信息与文献标准化技术委员会从成立以来一直由国家标准化行政主管部门管理。其工作范围与国际标准化组织第46技术委员会“信息与文献工作”(ISO/TC46Information and Documentation)的工作范围完全一致。

近30年来,在原国家标准局、国家技术监督局、国家标准化管理委员会的直接领导下,在国内各有关单位、专家、学者的共同努力下,全国信息与文献标准化技术委员会按照国际标准化组织的工作体系,将我国原本相对独立的图书、情报、档案、出版系统,通过全国信息与文献标准化技术委员会的工作机制,建立了我国实现信息与文献工作统一、协调、共享的工作基础,为实现我国信息与文献资源的共享发挥了重要作用。

全国信息与文献标准化技术委员会成立后,制定并颁布了近50项国家标准。这些标准的实施为推动我国图书、情报、档案、出版行业的标准化、信息化建设做了大量卓有成效的工作。30年来,我们初步建立起了文献信息资源组织、加工、利用和服务的标准化体系,为上个世纪80年代以来我国文献数据库建设、90年代中后期的图书馆、文献中心的自动化建设以及数字图书馆建设奠定了重要的技术基础,这些标准在实现我国文献著录、文献检索语言和数据交换的国际化和标准化过程中发挥了积极的作用。

1.1.2 主要问题 近30年的实践使得我国的信息与文献标准化工作取得了实质性的成绩,这一点有目共睹,也一直为信息文献界称道。但依然还不能满足社会信息化的需求,特别是面对网络化数字化的环境,面对未来的发展,还存在一些亟待解决的问题,主要表现在以下方面:①网络环境下的技术标准建设相对滞后,传统标准数量多,适应网络环境的新标准数量少;②标准的功能配置不到位,某些数据交换类标准、通信协议类标准和检索语言标准缺乏一致性测试,一定意义上影响了标准的有效应用;③尚未健全科学合理的信息文献标准体系,一定程度上造成标准制定在总体结构上不尽合理,例如术语类、字符集类等基础标准和方法标准的数量少于某些专业标准。

1.2 形势分析与对策

1.2.1 信息与文献标准化的发展趋势 现代信息技术飞速发展的背景下,信息与文献工作的发展引发了标准化的新的发展趋势,主要表现在以下三个方面:①国际范围内的文献与信息资源共建共享已成为现实和可能,在网络环境下信息资源建设和组织已具有利用国际化成果的特点;②信息资源组织的标准化建设已经由传统的注重信息资源本身加工和描述的标准化发展到关注到整个生命周期的标准化建设;③新型标准化组织层出不穷,譬如W3C、FILE等,在信息与文献标准领域,“事实上的标准”、“论坛标准”、“合作体标准”异常活跃,有的已被国际标准化组织和发达国家(以美国和日本为代表)吸纳,形成国际标准和相关的国家标准。

1.2.2 应对策略 以信息内容为主要对象的标准化工作更需要:①跟踪国际标准化组织确定的技术体系,强调这一领域标准化工作的统一、协调和可持续发展;②在信息产品的整个生命周期中,从信息产品的生产、流通、加工到利用等各个环节都采用统一的标准,才能实现信息资源的共建与共享;③在文献与信息资源建设中,保持技术上和方法上的先进性与国际性,从而保障所制定标准更具有科学性和通用性。

面对新的形势,加快文献与信息标准体系建设显得十分迫切,它将推动国家在该领域整体信息化水平的提高。一个科学合理的标准体系是实施标准的重要保证,抓好标准工作,对促进信息与文献事业的发展、整体提升信息与文献工作的效率会起到事半功倍的作用。

2 信息与文献标准体系的相关研究

2.1 信息与文献标准体系的有关概念

2.1.1 标准 ISO和GB/T20000.1-2002对“标准”的定义是:“为了在一定范围内获得最佳次序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范行文件”。并加注“标准应以科学、技术和经验的综合成果为基础,以促进最佳社会效益为目的”。

由此,我们可以看出:①标准是一种规范性文件,与其他规范性文件不同的是必须协商一致并由公认机构认定;②制定标准的对象是共同的重复使用的事物或概念;③标准产生的客观基础是科学技术成果和实践经验的总结;④标准的本质特征是统一,它是由标准主管机构批准,以特定形式,共同使用和重复使用的统一规定。

2.1.2 信息与文献标准 综上所述,信息与文献标准可以理解为:以情报学、图书馆学的基础理论、技术、方法和实践经验的综合成果为基础,对于信息与文献工作领域中比较稳定的重复性事物和概念,经有关方面协商一致,并由标准化主管机构批准,以特定形式予以,作为共同遵守的准则和依据的统一规定。

2.1.3 信息与文献标准体系 信息与文献标准体系则是在信息与文献领域内,按其基本规律和业务要求,由一系列相互依存、相互作用的标准形成的标准体系。它是指导信息与文献标准化工作的指导性文件,为信息化、网络化环境下的信息与文献业务工作提供新型标准和重要的技术基础。

2.2 信息与文献标准体系的定位

信息与文献标准体系的定位是:①明确信息与文献标准化的现状和发展趋势。通过信息与文献标准体系的研究和建设,可以科学合理地确立信息与文献标准化对标准的类目、内容、现状和发展趋向的总体与具体要求,从而推动标准的研究、制定和应用。②为信息与文献标准化发展提供决策依据。为信息与文献标准化主管部门提供所需标准的总体框架和发展蓝图,指明未来标准化工作的重点和发展方向;为信息与文献标准化研究者和工作者提供可供决策的信息;为技术委员会编制年度标准制修订计划提供依据。③有效避免标准制定的盲目性。为实现国家信息与文献标准化的总体要求,按照轻重缓急的原则,实事求是地向主管部门提出标准制修订项目的申请,使标准制定工作紧密结合信息与文献工作的需求,避免在标准制定工作中的盲目性和与实际工作脱节的现象。

2.3 信息与文献标准体系的构建原则

信息与文献标准体系是由信息与文献领域内具有一定内在联系的标准组成的科学有机整体,是包括现有、应有和

计划制定的标准工作蓝图,它勾画了信息与文献标准化的总体结构,反映了信息与文献领域内整体标准的相互关系。因此,在构建信息与文献标准体系过程中应遵循以下原则:

2.3.1 与国际体系一致的原则 全国信息与文献标准化技术委员会(国内编号TC4)成立于1979年,是我国最早成立的全国专业技术标准化委员会之一。委员会从成立一开始,业务范围就与国际标准化组织第46技术委员会“信息与文献工作”(ISO/TC46 Information and Documentation)完全一致。ISO/TC46的工作范围是:有关图书馆、文献和信息中心、出版业、档案、文件管理、博物馆文献、检索和文摘服务以及信息学等工作的标准化(见ISO官方网站,原文为:infor-mation centres,publishing,archives,records management,mu-seum documentation,indexing and abstracting services,and in-formation science)。

国际标准化组织将涉及情报信息、知识信息和载体信息的标准化工作统一归并在“信息和文献工作标准化”的范畴之内是有其道理的。无论图书馆、文献和信息中心、出版业(新闻出版)、档案馆,还是文件管理、博物馆文献、检索和文摘服务、以及信息服务等工作都属于“智力信息”的范畴,大信息、大交流是信息社会的基本特征。而上述领域划定的标准化工作领域,正是实现智力信息资源共享的基础和条件。特别是在信息技术和网络技术已经广泛应用的情况下,信息产品无论在内容还是在形态上的相互融合、彼此兼容已成趋势,必须从产品的生产、流通、加工到利用等各个环节都采用统一的标准,才能实现信息资源的共享。

2.3.2 信息资源生命周期的原则 信息与文献工作是一项涉及社会各个方面的基础性工作,也可以说任何部门、任何行业都会涉及到信息和文献工作。信息资源的组织利用和共享是信息与文献工作的根本。网络化、数字化的环境下,分布、异构和自主的信息资源不断涌现,需要从更高的层次和更系统化的视角来认识和组织信息资源,围绕着信息资源的创建、描述、组织、检索、服务和长期保存的整个生命周期来规划、设计、组织标准规范。有鉴于此,国际标准化组织第46技术委员会早在上世纪90年代中期,就将原第5分技术委员会(检索语言)、第6分技术委员会(著录)和第7分技术委员会(出版物格式)合并成第9分技术委员会(文献的描述与识别)。这样,一方面能对信息文献领域的信息资源建设提供系统化、基础性的指导和约束;另一方面,可保证各类信息资源的广泛可使用性,保障分布资源和服务的互操作,促进文献信息资源的长期保存和可持续利用。

2.3.3 开放建设的原则 信息与文献标准体系不应该是自定义一套标准或规范,而是充分吸纳和选择那些在国际范围被广泛接受和应用、得到有效标准化过程支持并具有良好可持续发展前景的标准和规范,减少标准规范制定和应用成本。

为保障所选标准和规范的可互操作性、可扩展性和可持续发展,信息与文献标准体系所列标准应充分体现采用国家标准、等同或修改采用国际标准和国外先进标准的原则。以保持信息与文献领域的标准与国际标准或国外先进标准的一致性或兼容性,以保证信息与文献领域的资源建设、应用系统建设等在全国或全球范围内共享。在信息与文献领域借鉴和参照的国际和国外发达国家标准有ISO、IEC、ITU、UNESCO、IFLA、DIN、BSI、ANSI等国际主流标准化机构、相关国际组织和发达国家的标准化机构制定的标准。

信息与文献标准体系建设应满足信息与文献业务不断发展的需要,特别是针对信息技术、网络技术等先进技术在信息与文献领域越来越广泛应用的现实,在标准体系建设中,要与时俱进,既要考虑当前的技术,也要对未来的发展有所预见,及时制定新标准和修订标准,使信息与文献标准体系所包容的标准能适应信息与文献领域各项业务工作的发展,适应网络化、数字化环境下信息与文献工作的实际需要。

3 信息与文献标准体系的层次结构

3.1 信息与文献标准体系的层次

信息与文献标准体系分为4个基本层次:第一层为信息与文献基础标准;第二层为信息与文献通用标准;第三层为信息与文献专用标准;第四层是信息与文献工作标准。信息与文献标准体系层次见图1。

3.2 信息与文献标准体系的结构

信息与文献基础标准、信息与文献通用标准、信息与文献专用标准和信息与文献工作标准可以是各自独立的子体系,也可以是多个子体系的组合,也可分成若干相互作用的子体系。

信息分类标准篇8

随着信息技术的高速发展以及工业化与信息化的深度融合,制造技术已经转变为信息制造,高度信息化是企业发展的必然趋势。大量信息化工具的使用,需要使用统一的信息代码进来确保各信息系统接口数据的统一。

2信息编码标准体系建设

2.1信息编码标准体系框架

围绕产品研制生产、企业信息管理、各业务应用、信息系统应用等方面,构建出符合企业全局性,科学、完整、协调的信息编码标准体系。标准体系,包括信息编码基础标准、信息对象编码标准、管理信息编码标准三大分支。编码对象涉及物资、产品及零组件、文件、固定资产、基础设施、生产信息中各类数据。全面总结企业信息化建设中需要编码对象,制定出标准体系框架,并将其按信息域划分合理的层次关系。

2.2企业编码标准编制

为确保各类急需信息编码的正确申请和使用,在贯彻执行集团标准的基础上,企业编制了《信息分类与编码标准编制要求》等基础标准,《物品分类信息描述与表达规范》等系列标准,规范了对物品进行信息描述与表达的一般要求、物品基本属性及填写要求、物品编码分类和物品数据整理要求,保障了信息代码的准确性。

2.2.1确定企业信息编码大类

结合企业实际物品资源将编码信息大类进行划分,企业内主要物品大类划分如下,按照划分进行便准编制以及体系建设。(1)标准件:紧固件、机体构件、卡箍、衬套、弹簧、管路连接及密封、操纵系统标准件、电气、仪表标准件、轴承、传动件等;(2)金属材料:钢材、铝材、镁材、钛材、铜材、银材、锌、锡、钴、镍等;(3)非金属材料:橡胶、塑料、胶粘剂、材料、涂料、密封剂、玻璃及玻璃纤维、石棉及石棉纤维、云母、燃料、基础化学品、纺织材料等;(4)复合材料:预浸料、芯材、碳纤维、芳纶纤维、混杂纤维等;(5)通用工具工装:刀具、量具、夹具等通用工具工装;(6)成品及附件:指独立交付给主机或配套单位的成品及附件;(7)自制半成品:包括自制毛坯、自制零组件、外协件等;(8)专用工具工装:刀具、夹具等专用工具工装;(9)设备备件:包括机械设备、动力设备、工程机械、机动车辆等设备的备件;(10)加工设备:包括机械设备等。

2.2.2明确企业编码标准编制任务

根据企业信息化建设的需求,根据企业物品资源种类特点,确定需要企业自行编制企业编码标准的清单目录,并按照需求的缓急程度,制定相应编制计划。同时,根据企业业务部门实际分工情况,落实标准编制单位和责任人。

2.2.3企业编码标准编制要求

确保编制的编码标准技术先进、适用性好、可操作性强。各项编码标准中要规定编码对象的编码规则、数据描述规范、使用要求等。标准的制定既要考虑科学性,也要考虑公司的实际情况与需求。编码标准对所约束的信息代码分类要达到以下要求:

(1)科学性。选择事物或概念(即分类对象)最稳定的本质属性或特征作为分类的基础和依据。

(2)系统性。将选定的事物、概念的属性或特征按一定排列顺序予以系统化,并形成一个科学合理的分类体系。

(3)可扩延性。通常应设置收容类目,以保证增加新的事物或概念时,不打乱已建立的分类体系,同时还应为下级信息管理系统在本分类体系的基础上进行延拓细化创造条件。

(1)兼容性。应与相关标准协调一致。

(2)综合实用性。分类应从系统工程角度出发,把局部问题放在系统整体中处理,达到系统最优。即在满足系统总任务、总要求的前提下,尽量满足系统内实际需要。

3编码基础数据整理工作

(1)数据属性的填写一定要按照标准要求,达到百分之百准确。避免出现数字“0”与小写英文字母“o”、数字“1”与小写英文字母“i”或“l”、数字“2”与小写英文字母“z”混填或替代填写,以及半角、全角字符使用不当等情况。

(2)对于信息化系统中的编码数据,将新编码存放在指定的属性中,待全部新编码填写完成后,一起将新编码转到数据的主键标识位置上,减少新旧编码同时存在造成的混乱;

(3)新编码生成后,信息化系统中旧编码不宜彻底删除,可以存放在数据的属性中,与新编码同时存在,既方便老数据查询,同时提供对照信息。

4编码数据应用

基础数据整理完成后按照编码标准规定的“基础数据编码申请”流程和“基础数据编码更改(修改、废止)”流程在编码管理平台进行申码等工作。各类编码数据在企业信息化软件平台上得到充分使用,除了上文提到的门户系统等中使用外,在PDM(产品数据管理)、ERP(企业资源计划)等系统中也完成集成使用。通过物料主数据处理、EBOM/PBOM管理、工艺路线管理、生产排产管理、财务管理、库房物料管理等功能模块,对企业信息流、物流和资金流等资源进行管理,确保企业计划决策的实时准确。

5结语

建立完善有效地编码标准体系,结合企业实际编制相应企业编码标准,保障企业各类编码数据的准确有效,形成企业代码数据库,是编码标准的基本内容和作用。只有在编码标准的约束下才能够生成合格代码,为企业信息化建设奠定坚实基础,保证企业数据在各信息化应用系统的之间的顺畅流转。

参考文献:

信息分类标准篇9

XBRL是基于XML语言的标准化财务报告,相对于传统的财务报告,其优越性主要体现在:第一基于XML的跨平台优势,能够解决“信息孤岛”问题;第二是可靠性方面,XBRL自身提供了强大的验证机制,而且其柔性化报告模式的可能性能够在未来实现连续审计;第三是克服信息过载的问题,加强信息使用者获取信息的方便程度。XBRL的技术架构按层次分为技术规范、分类标准和实例文档三部分。技术规范定义了创建XBRL分类标准和实例文档等应遵循的技术规则;分类标准由技术规范的FRTA制定,包含一个模式文档和若干链接库文件,是财务元素概念和关系的集合;实例文档由技术规范的FRIS和分类标准共同决定,是对财务元素的情景化和实值化,最终体现为财务报告。分类标准和实例文档是会计人员接触的范畴。

二、XBRL对会计信息质量的改善作用

(一)分类标准对于会计信息质量的改善

本文主要介绍分类标准部分功能在可靠性和可比性上的提高作用。在最新XBRL2.1规范的支持下,通用分类标准的制定上能够对公式链接库和维度链接库进行定义。XBRL文件中的公式链接库具备强大的本地验证功能,其断言功能能够判断财务数据勾稽关系的一致性和异常值。相对于狭义的公式,公式链接库会根据事实值来生成布尔值进行断言,只要将会计业务规则转化在公式中进行实现,那么财务数据的验证效率和正确率将得以显著提高,提高信息质量的可靠性。另一方面,XBRL文件中的维度链接库克服了传统财务报告表格数据的结构固化导致的可比性差的问题,在文件中的超立方体项包含了定义好的各种维度,基本的财务元素会通过超立方体项加载上不同的维度成员,例如“库存商品”可以装载上“地区”和“商品种类”两个维度来制表。维度链接库灵活列示表格信息的功能有效解决了传统财务报告表格维度不一致而可比性差的难题。

(二)XBRL外部技术支持对会计信息质量的改善

针对XBRL的平台和技术等外部支持也能提高会计信息质量。对于传统财务报告,当多种不同需求主体需求财务报告时,往往需要在需求主体的相应系统中进行二次人工转换,会提高信息差错的可能性,而XBRL具备跨平台的优势,可以自由在不同系统之间进行无缝交换,加强了信息的可靠性和获取相关信息的及时性。而且,对于不同的信息需求者来讲,XBRL实例文档能根据各种样式表转换为各种不同的列报方式,支持主表和附注之间的跳转,降低信息使用者的认知成本,改善信息的相关性。目前,沪深两市的XBRL平台已经实现了会计信息的相互可比,信息使用者可以得到最多5家不同企业的横向比较与同一企业5年信息的纵向比较,信息的可比性也得到显著提高。

三、XBRL信息质量的现存问题分析

(一)分类标准的适用性问题

我国财政部考虑了与IFRS的趋同性,因此在制定模式上效仿IFRS分类标准,以会计准则为导向进行通用分类标准的制定,这使得通用分类标准能够与企业会计准则高度契合,财务元素与披露规则的匹配性较好。但这样的分类标准制定模式没有考虑到企业在报告实务中的偏好性问题,这导致企业在XBRL的编制中会自行扩展财务元素。在自行扩展上,企业在不仅要扩展元素,还需要扩展元素之间的关系,我国会计人员的XBRL技能与经验尚不成熟,在XBRL的编制上出错率较高,容易出现对扩展元素概念和概念关系的认知差错,元素的扩展反而会降级信息质量的可靠性。

(二)XBRL的技术复杂性问题

通用分类标准的维度链接库为信息质量的改善提供了强大的功能。但是维度仍然由财政部固化在分类标准当中,不同行业为满足自身在附注上的实务偏好也要对维度进行扩展,这对会计从业人员的计算机水平提出了更高的要求。目前通用分类标准的元素结构实现了扁平化,元素之间的关系只能通过定义、展示等链接库进行表示。而我国的会计人员缺乏XBRL培训的背景,对这种扁平而缺乏层次的财务元素结构难以理解,很难灵活运用XBRL的维度功能。同时XBRL技术的复杂性导致进入成本较高,其在企业中采纳和扩散也受到了阻碍。因此,XBRL对信息质量的改善上目前存在着较大的局限性。

(三)XBRL信息安全和审计问题

公式链接库的校验功能主要通过软件开发商来实现,而且已经能够满足证券市场对XBRL业务规则的需求。但是该优势仅体现在本地检验上。XML自身并没有对数据传输过程中的完整性提供校验和加密机制,这使得XBRL报表在传输过程中仍然存在着信息丢失和遭受拦截篡改的可能性。我国沪市在同步报送财务报告和XBRL报告时,会提醒用户以财务信息仍然要以PDF报告为准,也反应了这一情况。除了信息安全存在风险之外,我国对也没有针对XBRL报告的审计体系,目前两市直接以审计后的PDF报告生成XBRL文档,没有对XBRL的分类标准质量和实例文档的质量进行进一步审计,这也使XBRL表达出来财务信息缺乏足够的可靠性和准确性。在国外已有学者基于XBRL上扩展出了XARL语言,目的是对XBRL报告进行审计鉴证,提高信息使用者对于信息真实性评估的确定性,目前国内对于XARL的研究极少,相关工作也难以开展。

(四)XBRL报告的有用性问题

张天西、李晓荣(2011)指出XBRL的潜力之一就是支持数据挖掘工作。目前沪深两市仍然在采用各自的分类标准,实例文档中仅包含了合并过后的数据信息,没有对财务信息元素进行进一步细分,数据的向下挖掘没有实现。要实现从报表到账簿的追溯,需要将会计账簿标准化,这需要XBRLGL的支持。我国对标准账的应用仍处于探索阶段,目前XBRL并不能提高内部决策的有用性。另外,沪深两市的XBRL平台的功能比较单一,用户仅能获取限定年份的主表信息,主表和附注之间的跳转等帮助用户理解的功能也没有实现,外部决策的有用性上也没有得到充分体现。

四、小结

对于XBRL对信息质量改善存在的问题,相关部门应充分考虑不同的行业特征,改善通用分类标准,避免企业自行扩展过多的财务元素;投入资金加强会计人员的XBRL技能培训,提高市场的认知接纳水平,加快通用分类标准在两市的推广运用;建立XBRL的信息安全保障体系,在信息安全管理方面加快建立风险评估和审计机制;利用多种优惠政策鼓励软件开发商对于标准账的开发工作,尽快实现XBRL信息的数据挖掘功能。

参考文献

信息分类标准篇10

文献标识码:A文章编号:

16721101(2015)02003605

Abstract: Based on information entropy from the perspective of data quantity under index system of regional development, this paper establishes the way of evaluation by the standard of information entropy, explores how to improve the information of data using fuzzy c-means algorithm, and validates the the proposed method from theoretical proof and empirical analysis.The paper makes improving experiments via panel data under comprehensive index system of regions of northern Anhui and along the Huaihe river.Its result suggests diversity in data by information entropy standard and marked improvement of information, which lays good basis of better data quality for consequent data mining.

Key words:regional development; quality of panel data; information entropy; fuzzy c-means algorithm; feasibility demonstration

在现代信息技术迅猛发展的背景下,越来越多的领域都采用数据驱动的方式进行研究。应运而生的数据技术从传统的统计分析到数据挖掘,再到现今的云计算和大数据都很好的给生产生活带来更多的价值。但是随之而来的数据量度和尺度都变得纷繁复杂,再加上各行业所取观测指标的不同使得数据在单位、量纲和指标含义等客观情况下呈现很大差异性和不确定性,特别是经济数据指标的数值差距过大,因此给数据技术方法本身的可行性以及所得结果的可靠性带来很大挑战。传统的数据预处理中多采用清理、变换和规约等方法来提高数据质量[1,2],在大多数文献中多采用Min-Max标准化[3,4]、Z-score标准化[4]、Decimal scaling小数定标标准化[5]以及Log和Atan函数转化[6]来处理数据,并不着重讨论数据达到的质量程度。但是由于标准化方法的一些理论局限性,容易在处理中降低数据的信息量。所以在研究中如何能够判断标准化后数据信息量的改变程度,这对采用的技术方法本身和后续结果分析将起到重要的作用。本文将尝试探讨数据信息量衡量熵标准,并从理论层面和结合皖北沿淮区域经济发展数据做相应的实证分析。

一、构建熵标准下FCM分类改进模型

(一)信息熵与FCM准备

1.数据质量的信息熵标准

热力学第二定律表明孤立系统中任何变化都不可能减少熵值,1948年Shannon定义通信信号中平均信息量为熵[7],从此熵作为衡量信息量的一种方式被广泛应用。信息熵是数据含载信息程度的一种度量方式,当信息熵越大时表明数据越无序,需要理清数据所需信息就越多,也说明数据的信息量越大。离散随机变量的信息熵定义为自信息的平均值

H(X)=Ep(x)[I(x)]=-∑xp(x)logp(x)

其中I(x)为事件的自信息,Ep(x)表示对随机变量的概率取平均运算。其具有熵的非负性、对称性、扩展性和可加性等相关性质。

2.模糊C均值聚类FCM

模糊C均值聚类[8,9](FCM)是由Bezdek在1981年提出的一种模糊分类方法,FCM需要根据类中距和类间距构造分类准则,利用预先给定的分类数C对所给样本点进行分类。即求解规划问题:

minJm(U,Z,c)=∑ci=1∑Nk=1μhikd2ik,

s.t.∑ci=1μik=1,l≤k≤N;0≤μik≤1;

通过求解上面规划问题,利用得到的隶属矩阵Uik=∑cj=1(dikdjk)-2m-1和聚类中心

Ci=∑nk=1umikXk∑nk=1umik,进行迭代运算得到分类结果。

(二) 熵标准下FCM分类改进模型

由于熵值代表了数据的信息量,而通过衡量信息量可以产生评价策略,陈衍泰等在综合评价方法分类的研究中总结了信息熵方法应用在评价领域的情况[10],张树森等将熵与聚类算法结合提出改进的模糊聚类算法EFC[11],韩宇平等将最大熵原理用于评价区域水资源短缺问题[12],刘红琴等将信息熵应用到能源消费的分配衡量中[13],本文考虑将信息熵引入到数据质量的评价中。

再由于区域发展数据在数值上差距过大,如果仅仅统一进行z-score标准化处理则可能带来信息损失,本文考虑利用FCM方法将数据进行分类标准化,这样也同时带来数据扁平化特征,而由离散最大熵定理[7]可知,数据出现概率越相同,那么数据的信息熵越大。

设n维数据集{xi}ni=1进行z-score标准化后{xi-μσ}ni=1在D段中出现的概率为{Pj(x)}Dj=1,利用FCM对数据分C类后原始数据重新组合变为{xij}i=1,…C,j=1…ni,在每个数据集中表转化得到数据集{xij-μiσ}i=1,…C,j=1…ni在D段中出现的概率为{Qj(x)}Dj=1,当分段数D足够体现数据概率分布时Q(x)比P(x)更加趋近相同概率。利用P(x)对Q(x)的散度D(P//Q)非负特征,有如下推导:

D(P//Q)=∑xP(x)logP(x)Q(x)=

∑xP(x)logP(x)-

∑xP(x)logQ(x)≥0

Hp(x)=-

∑xP(x)logP(x)≤

-∑xP(x)logQ(x)≤-

∑xQ(x)logQ(x)=HQ(x)

因此在分类标准化后的数据信息量比直接标准化的信息量要大。从分类的角度来看,分类后数据标准化数值会产生比整体标准化更多的多样性,从而带来的信息量的增加,而数据信息量的增加也给后续的研究方法提供更好的数据质量。

二、基于区域发展面板数据的实证分析

(一)指标体系构建与数据来源说明

1.区域发展指标体系构建

结合前期工作制定指标体系[14]21,指标的选取原则兼顾经济、生活、环境、社会、特征产业和可持续发展的指标体系,构建一级指标,细化二级指标共选取5个一级指标和69个二级指标如图1所示,并由此构建整体指标模型和各级别体系。

具体指标表现为:(1)在经济发展与产业结构方面:GDP;城镇固定资产投资额;出口总额;进口总额;农业总产值;工业总产值;建筑业乡村从业人员数;交通运输、仓储及邮政业乡村从业人员数;乡村私营企业从业人员数;农、林、牧、渔业乡村从业人员数;乡村个体从业人员数;工业从业人员年平均人数;城镇房地产开发投资额;(2)民生能力与生活质量:职工工资总额;总户数;农民人均纯收入;城乡居民储蓄存款余额;社会消费品零售总额;城镇居民最低生活保障人数;新型农村合作医疗参合率;建成区绿化覆盖率;城市出租汽车数;公共汽(电)车客运总量(市辖区);人口自然增长率;城市公共汽(电)车客运总量;城市每万人拥有公共交通车辆数;城市人口密度;人口密度;基本养老保险基金支出;基本医疗保险参保人数;人均公园绿地面积;(3)政府管理与社会服务:财政收入;财政支出;财政用于教育的支出;财政支出中卫生经费;等级公路里程;公路货物周转量;公路旅客周转量;公路客运量;铁路客运量;城市道路长度;城市供水总量;城市清扫保洁面积;城市天然气供气量;地质灾害防治投资;城市公园数;街道办事处数量;(4)资源实力与可持续发展:降水量;人均水资源量;土地面积;林业用地面积;水田耕地面积;城市污水排放量;生活垃圾无害化处理率;城市排水管道长度;城市污水处理率;工业废气排放量;工业废水排放量;“三废”综合利用产品产值;(5)教育产业与创新科技:财政用于教育的支出;普通高等学校数;普通高等学校在校学生数;普通高中在校学生数;普通小学在校生数;发明专利申请受理量;发明专利授权量;科技活动人员数;

图1综合区域发展指标结构图

基于以上初步指标体系充分涵盖从经济发展到人民生活,从政府能力到社会服务,从可持续发展到特色产业的方方面面,兼顾发展的效率、速度、质量、潜力和能力。但是在数据收集中往往遇到很多实际情况需要做修正,对于少部分的数据遗漏采用数据拟合回归和缺省值补充等传统数据预处理方法进行修整[1],对于大部分的数据遗漏则采用指标替换的方式进行变通。

2.面板数据来源说明

本文依托皖北沿淮地区6市39县区的区域发展研究,因为在皖北沿淮地区中蚌埠市和淮南市具有相同的地缘特征和相似生活特征,所以对两个地区指标的衡量具有很好的实际意义,故而采用2005年到2012年蚌埠市和淮南市数据,数据来源于中国知网提供的《中国统计年鉴》、《中国城市统计年鉴》和各地区发展统计年鉴等。同时本文数据属于面板数据,可以克服时间序列分析受多重共线性的困扰,能够提供更多信息、变化、自由度和估计效率。

(二)具体实证分析

本文的具体实证分析分为以下三个方面:(1)对于原始数据的处理过程:按照论文前面介绍的科学指标模型和数据采集来源,将两个城市69个属性从2005年到2012年共8年的数据进行矩阵化,得到一个138行8列的原始数据矩阵,对于原始数据矩阵中的缺省值采用外插和内插法进行相应的差值拟合得到完整的使用数据。(2)对于使用数据的分析过程:第一步根据本文前期工作[14]22通过对数据进行谱系聚类、HCM和FCM三种聚类方法,采用Matlab2012b进行编程,比较从分2类到分10类的由R方统计量和伪F统计量得到的半偏相关统计量SPRSQ数值,发现当分三类时谱系聚类方法和HCM的SPRSQ数值达到最高值分别为0.400 1和0.023 9,而FCM的SPRSQ数值在分四类时达到最高值0.027 0,因此在进行分类构建信息熵时,将分三类和分四类的情况均予以考虑。第二步根据论文前面讨论的信息熵构建过程进行分类信息熵构建,首先将利用FCM对数据分三类和分四类得到的数据集

{xij}i=1,…C,j=1…ni(其中C=3或者4),在每个数据集进行z-score标准化:{xij-μiσi}i=1,…C,j=1…ni;然后讨论这些数据在分D段中出现的概率{Qj(x)}Dj=1,其中分段数D的大小要足够体现数据概率分布特征 [7,11]取D分别为10和20两种情况,计算相关信息熵数值H(X)=

EQ(x)[I(x)]=-∑xQ(x)logQ(x)

;最后通过和没有进行分段改进的原始数据集的未标准化和统一标准化两种情况进行比较得到相关结论。(3)对于数值比较的分析结果:通过比较未标准化、普通的列统一标准化和采用FCM分三类和四类的类标准化的三种方法在取分段数为10和20下的信息熵大小,得到了相关的数值结果表1。

对表1中的相关数值做图进行直观的表达,可以得到在分10段情况下的图2和分20段情况下的图3,其中横坐标为从2005年到2012年每一年的数据情况,从图中可以发现不论哪一年的数据数值在分类标准化后的熵值都高于图中最下面的线,即统一标准化的数据熵值。

从以上图表的结果来看,采用FCM算法对于数据分类标准化后得到的信息熵提升效果是明显的,具体可以概括为以下的一些结论:

1.未标准化和统一标准化的结果数值完全一样,这是因为z-score标准化过程并不改变数据分布特征,因此他们拥有相同的概率分布,则信息熵也完全一致,故而数据所含信息不变,因此在作图阶段就不体现未标准化的结果图形。

2.分段标准化后所有的数据结果均大于统一标准化的数据值,即信息熵在分段标准化后都有显著提高,这和理论推导的结果一致。故而分段标准化的方法可以有效消除量纲差异,同时还能有效的提高数据信息熵,从而使得数据含有更好的信息量。

3.就分段标准化而言从所有列信息熵的总和数值可以发现,在两种最佳聚类数时信息熵的总和情况分别可以表示为:分10段3类时的9.07高于4类时的7.8,分20段3类时的12.19高于4类时的11;同时数据信息熵随着分段的增大数值也在增大,这是信息熵本身性质所决定的,因为分段越多概率分布越接近均匀分布,由离散最大熵定理以及本文理论推导可知数据信息熵在增加。但是如果分段过多,甚至达到数据总量的一定比例,此时再高的信息熵数值也并不能够说明很好的信息量,所以在分段数的选取需要与数据总量相互匹配。

三、结论

根据以上论证发现,从理论角度和实证分析都验证了分类标准化可以有效的提高数据信息量。所以在相应数据分析方法使用之前,对于数据标准化处理阶段可以尝试采用分类标准化的方式,这样既可以消除数据量纲差异,也可以有效的提高数据含载信息,为进一步使用数据挖掘方法得到更好的数据结论提供较好的前期准备。

同时由于在数据集统一标准化中均值唯一,相当于只有一个中心节点。但是在分类标准化后,在不同类中都有相应的均值作为中心节点,所以分类标准化比传统的统一标准化更符合现代互联网思维,那就是去中心化和多节点多分类,以及扁平化结构体系的相关思想。参考文献:

[1]Jiawei Han.Data Mining Concepts and Techniques, Second Edition[M].BeiJing: China Machine Press,2008:30-65.

[2]韩京宇.数据质量研究综述[J].计算机科学,2008(2):1-5.

[3]程惠芳,唐辉亮.开放条件下区域经济转型升级综合能力评价研究――中国31个省市转型升级评价指标体系分析[J].管理世界,2011(8):173-174.

[4]张钢.长江三角洲16个城市政府能力的比较研究[J].管理世界,2004(8):18-27.

[5]安悦.基于微博客的手机供应商排名推荐[J].数学的认识与实践,2013(10):23-29.

[6]汪冬华.我国沪深300股指期货和现货市场的交叉相关性及其风险[J].系统工程理论与实践,2014(3):631-639.

[7]田宝玉.信息论基础[M].北京:人民邮电出版社,2008:18-26.

[8]史小松,黄勇杰,刘永革.数据挖掘技术中聚类的几种常用方法比较[J].中国科技信息,2009(20):99-105.

[9]诸克军,苏顺华,黎金玲.模糊C均值中的最优聚类与最佳聚类数[J].系统工程理论与实践,2005(3):52-61.

[10]陈衍泰.综合评价方法分类及研究进展[J].管理科学学报,2004(2):69-77.

[11]张树森.改进的基于熵的中心聚类算法[J].计算机与现代化,2014(3):53-56.

[12]韩宇平.基于最大熵原理的区域水资源短缺风险综合评估[J].安徽农业科学,2011(1):397-399.

信息分类标准篇11

卫生信息框架是全面捕获卫生信息、并对其进行初步分类的基本工具。人的健康和卫生服务的复杂性,决定了卫生信息具有以下两个特点: 一是信息来源广泛、内容重叠,二是信息数量巨大。卫生信息标准化的基本对象是卫生信息,在对卫生信息进行标准化处理时,首先要明确卫生信息的基本范畴,并通过标准化的方式把分散在各地、各级卫生机构的卫生信息片段,按照一定顺序(模式)排列和整合,最后集成为满足各种临床和管理决策所需要的完整信息。卫生信息框架为上述过程提供了基本框架和工具。所以,卫生信息框架是制定卫生信息标准的第一步,是制定其他相关标准,如数据元与元数据规范、信息交换标准等的前提,是对信息进行标准化描述,并实现共享与交换的基础。

信息使用者要根据信息框架的范围和内容确定信息需求,信息系统的设计者要根据信息框架对特定领域进行功能建模和需求分析。

卫生信息数据模型是对特定范围内的对象及其特征的描述,它定义所要获取的数据。卫生信息数据模型在卫生信息框架的基础上对所需要的数据进行详细分类,与元数据描述框架和数据字典一起,给出数据在特定语境下的明确的、统一的定义。所以,国家卫生信息数据模型及其对应的元数据管理框架是实现数据可理解、可共享、可整合和可分析利用的关键。无论是业务功能分析还是技术实现,应用数据模型和数据字典是实现语义互操作的重要保证。

作为数据的产生和使用者,不同的职能部门需要根据自己的业务需要建立自己的数据模型,但都可以与国家卫生信息数据模型进行比照或组合,最大限度地重用国家卫生信息数据模型中已经标准化的数据定义和表达规范; 作为采集、存储数据的计算机系统,可依据国家卫生信息数据模型,制定应用软件的基本功能、业务流程、物理设计的规范和要求,并按照数据字典,定义系统的数据结构和分类代码。

国家卫生信息标准基础框架所针对的关键问题,以及可由该框架产生的部分标准规范详见附表。

例如: 支持国家宏观决策是卫生信息的首要功能。要及时准确地得到相关数据,首先要建立一个满足国家宏观决策需要的统计指标体系,该指标体系应该是信息框架的一个映射和应用,其内容可以用框架进行归纳和分类,以保证框架的完整性,并发现在信息收集上的缺陷和问题。为此,须根据宏观决策所关注的问题,在信息框架的基础上制定新的国家卫生统计指标体系。其次,将所有统计指标按照信息模型提供的实体分类模式,对所有数据元进行归纳整理,最后,根据元数据描述框架制定相应的数据字典,用该字典提出的数据元描述规范指导国家卫生统计的数据采集、存储、交换、和统计分析。

其次,基础框架是卫生信息标准研究的方法学和技术指南。

国家卫生信息标准基础框架为在已有信息标准资源和现有信息资源的基础上,建立业务功能模型、信息系统和数据库逻辑模型以及物理模型提供了基本参照和方法学依据,对开展卫生信息资源规划等一系列标准化和信息化建设也具有重要指导和规范作用。如图所示。

信息分类标准篇12

一、信息化建设与知识管理

信息化建设是以知识管理为核心,信息资源为基础,提高组织核心竞争力为目的的全面整合或再造组织业务流程的过程。知识管理是获取、储存、学习、共享、创新知识的管理控制过程。在信息化建设中,企业、政府等组织通过知识管理,从现有的业务流程和数据中,挖掘、获取并确定各类知识资源,定位拥有专业知识、经验的个体,将个体的知识、经验、信息提升为组织的知识资源,有序传递、整合、规划和有效利用知识资源,有助于提高组织的整体业务、技术和管理水平。

在承建单位实施信息化建设中,知识管理是通过公司内雇员、部门、可能的跨国公司合作、与业主的沟通协调,传递、整合、有效利用本单位的知识资源,运用信息技术,通过设计最优技术方案、控制施工质量,共享和创造知识价值。

在信息化建设中,对组织内各种各类知识进行评估,挖掘、获取真正有用的知识。知识不仅仅是信息,是显性知识和隐性知识的集合。通过评估,区分知识和信息、知识管理和信息管理,以实现资源的充分开发与应用。

整合或再造业务流程,是与知识管理密切相关的。1990年美国管理专家Michael Hammer提出了“业务流程重组”(Business Process ReengineeringBPR)的概念,它是以用户需求为导向,信息化、知识化为基础,对用户的业务流程进行再思考、关键性的重新设计和根本的变革,从而获得在成本、质量、服务和速度等方面业绩的持续改善。在业务流程重组中,信息(知识)的获取、分类、存储、利用,只有与知识管理结合,才能够发挥更有效的作用。

知识管理技术贯穿于信息化建设始终,它与信息技术相辅相成。在知识获取、学习、共享、创新的过程中,整合各种信息技术,构建完整的知识管理体系,是知识经济时代信息技术的新发展。

二、信息资源规划和整合

信息资源整合(Information Resource Integrating, IRI)的前提是进行统一的信息资源规划(Information Resource Planning, IRP),消除“信息孤岛”,共享信息资源。信息资源的规划是实施信息化工程的基础,IRP的基础是建立信息资源管理基础标准,IRI的实质是通过信息技术改造、重建或重构数据环境。信息产业部的《信息系统工程监理暂行规定》中定义信息资源系统为“以信息技术为主要手段建立的信息资源采集、储存、处理的资源系统”。

在信息化建设中,信息资源规划是很重要的一环。在组织的生产、经营、服务活动中,会产生大量的数据、资料、指标、图纸、报表及其它显性资源,也存在各种各类的知识、拥有专业知识和经验的个体等隐性资源。信息资源规划是对实施信息化后产生、控制、使用这些资源进行识别和分类;评估、挖掘、获取、共享各类知识;对承载信息资源的信息基础设施进行分析、设计和指导。

(一)信息资源规划的主要任务

信息资源规划的任务是对支撑业务流程的逻辑相关的数据进行分类,建立具有结构化、标准化、一致性的共享数据库。分析业务流程重组后产生、控制和使用的数据,了解各种数据的内容、范围、可靠性等,理解数据的共享要求和应用策略以及数据使用中的问题,使信息资源规划能够满足数据资源的管理要求。

(二)信息资源管理标准

信息资源管理标准是指决定信息系统质量的、进行信息资源开发利用的基本标准。威廉·德雷尔1985年在其《数据管理》专著中总结了信息资源管理的基础标准———数据管理五项标准,内容如下:

1.数据元素标准。数据元素(Data Elements)是信息资源中最小的信息单位,是抽象的数据对象。它的质量是构建稳定的数据结构基础的关键。数据元素标准包括数据元素命名标准、标数据元素识标准和数据元素一致性标准。

2.信息分类编码标准。是信息标准中的基础标准。信息分类编码(Information Classifying and Coding)的对象,是一些最重要的数据元素,自动处理、检索、存储和传输信息的质量及效率与这些元素紧密相关。信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立一定的分类系统和排列顺序,便于管理和使用信息。信息编码就是在信息分类的基础上,将编码对象赋予有一定规律性的、易于计算机和人识别和处理的符号。信息分类编码工作要确定每个编码对象的编码规则、码表结构和代码表。

3.用户视图标准。用户视图(User View)是一些数据元素的集合,表示用户对信息需求和数据实体的最终解释。用户视图是数据的系统外在表现形式,是系统的输入、输出媒介和手段。用户视图与外部数据流是同一词,来自某个数据源或流向某个数据接收端的数据流。常用的用户视图有纸面的,如图纸、单证、表单、报表、账册等;有电子的,如屏幕格式等。

4.概念数据库标准。概念数据库(Conceptual Database)是用户对数据存储的最终解释。用户的信息需求,应首先界定概念数据库。概念数据库是综合信息资源用户的数据要求构成的全局数据库,表示数据库的整体数据组织状况和逻辑结构。

5.逻辑数据库标准。逻辑数据库(Logical Database)是系统分析设计人员的解释。在关系数据库模型中,逻辑数据库是一组规范化的基本表(Base Table),是从概念数据库中映射出的所需信息。逻辑数据库表示的是局部数据的数据库逻辑结构。

(三)信息资源规划方案

在定义数据管理标准的基础上,制定信息资源规划方案,为业务流程重组提供依据,为系统设计提供基础。

在信息资源规划中,将隐性资源转变为显性资源,有序传递、整合、规划和有效利用各类知识资源。因此,信息资源规划是资源的知识管理规划。信息技术的投资,可能不会给企业带来明显的效益,因为基于信息的竞争优势正在逐渐转变为基于知识管理的竞争优势,以信息资源规划为核心的信息系统规划,如果不实施知识管理,将不会产生显著的信息化效益。

信息分类标准篇13

二、XBRL应用于会计信息系统存在的问题

(一)管理者对会计信息化和XBRL认识不足有些管理者将会计电算化当作会计信息化,认为会计信息化就是利用计算机处理会计数据,以减少财务人员的工作量,提高劳动效率和质量。XBRL在我国的应用时间很短,企业经营管理者对XBRL的认识不足或只停留在表面上,不了解XBRL的作用及带来的经济利益。有些管理者甚至不愿意应用XBRL来提高财务信息透明度,害怕将企业内部控制的弱点暴露出来,使企业相关者的利益分配受到影响。

(二)制定XBRL标准的国内专家很少国内能够真正理解并且精通XBRL标准的专家较少,很多研究者只是在理论上对XBRL标准进行研究,不能将标准真正融入会计信息系统。国内第一个实际应用XBRL标准的是上海证券交易所年报标准化报送系统。

(三)适合企业发展的XBRL分类标准不完善我国的《企业会计准则通用分类准则》自2011年颁布以来陆续在大型国有企业、上市公司及银行业等金融机构中实施,但目前还没有制定出完善的、适合企业发展的XBRL分类标准。《企业会计准则通用分类准则》仅仅给出了工业企业会计报表的相关会计科目,而对其他行业没有给出适用的会计报表科目。

(四)XBRL系统软件研发技术落后、资金支持不足要想使XBRL在会计信息系统中发挥应有的作用,必须有成熟的财务软件与之配套。但国内市场还没有开发出成熟的软件,现有的ERP软件不能很好地兼容XBRL,不能保证XBRL在稳定的系统中应用。此外,软件企业缺乏政策的扶持,其投入到XBRL的资金较少,很难开发出适应国内会计信息系统的软件。

(五)缺乏研究XBRL系统的复合型高级人才会计信息化是信息技术与会计相结合的产物,XBRL项目开发需要一支高素质的复合型人才队伍,他们不仅有扎实的财务专业理论知识和经营管理能力,而且精通计算机技术,能熟练操作财务软件,进行计算机的日常维护,解决实际工作中的各种问题。低层次财会人员的过剩及精通XBRL技术人才的匮乏,阻碍了企业会计信息化的发展。

(六)会计信息安全问题是会计信息化的制约因素会计信息化平台是建立在计算机、网络及通讯等现代化信息技术基础上的,会计信息系统中的财务软件也是以现代化信息技术手段为依托,但网络安全、信息畅通等问题一直没有得到有效解决。信息技术的不断发展和进步,是网络安全和信息畅通的保证。

三、XBRL应用于会计信息系统的对策

(一)提高企业管理者对会计信息化和XBRL的认识水平XBRL意为可扩展的商业报告语言,它是以互联网联结为基础,运用XBRL分类标准实现企业间信息的实时、准确、高效存储、操作、多用途使用与数据交换,使企业的内外部信息交流及整个商业活动形成一个无缝的信息传递网。企业管理者不仅要理解和支持会计信息化,而且要高度重视和积极参与会计信息化工作,为建立基于XBRL的会计信息系统提供保障。会计信息化是管理信息化的重要组成部分,企业在制定管理信息化总体规划时要考虑自身的实际情况和需要,制定科学合理的会计信息化发展规划。企业管理信息化和会计信息化是一项系统工程,将XBRL融入会计信息系统,实现企业人、财、物的实时监控,做到人尽其用、财尽其利、物畅其流,对于企业经济效益的提高大有裨益。

(二)成立XBRL分类标准研究机构政府要尽快成立研发XBRL分类标准的机构,加强对XBRL知识的宣传和培训,为企业了解和学习XBRL创造各种可能的机会。由于我国的会计准则、会计制度、审计准则是由财政部组织和参与制定的,所以最好由财政部带头研究XBRL分类标准,以建立国内XBRL分类标准中关于标准化的会计科目和报表项目,使会计科目、报表项目按照一定的标准规范表达,便于公司之间数据的转换。此外,财政部还应组织制定XBRL分类文档翻译计划。XBRL仅是一个电子财务报告文件的标准格式,不会改变会计准则,也不要求企业必须提供会计准则或会计制度规定以外的财务信息。因此,XBRL分类标准的制定应由财政部门牵头,以适用的企业会计准则和会计制度为依据,制定出中文架构下的XBRL分类标准。我国还应关注其他国家研究XBRL的最新动向,积极参与制定国际XBRL分类标准,争取在国际标准上拥有话语权。同时,我们要借鉴国际组织和其他国家的研究动向和成果,避免重复研究带来的资源和时间浪费。要积极表达我们对XBRL分类标准的看法,以减少不同国家XBRL分类标准之间的差异。

(三)健全XBRL分类标准相关体系,加强配套设施建设首先,应根据国家修订企业会计准则的进展情况,选择有利时机修订XBRL通用分类标准,推出与国际标准趋同的XBRL通用分类标准。其次,应加快制定各个行业的扩展分类标准。再次,应尽快开发出能够与XBRL相融合的财务软件,并确定接口标准。

(四)加大XBRL技术研发力度,提供足够的资金支持企业应与高等院校和研发机构进行合作开发,或者聘请专家作为企业的技术顾问,合作开发适用于企业需要的XBRL,解决XBRL实施过程中出现的技术难题。充足的资金投入是XBRL快速发展和技术完善的保障,在目前多数企业面临资金不足的情况下,政府及相关部门应给予企业经济支持,以解决资金短缺的问题。

(五)培养符合XBRL技术要求的复合型财会人才XBRL标准的制定需要用到会计理论、计算机、编程技术、网络技术等相关知识,必须重视优秀复合型人才的培养与引进,以改善XBRL人才缺乏的状况。国家要从宏观的角度加大XBRL方面的教育投资,培养能够满足信息化发展需要的XBRL人才。企业要结合自身的实际情况,加强对会计人员的后续培训,提高会计人员的知识和能力水平,培养复合型财会人才,以满足会计信息化发展的要求。

在线咨询
了解我们
获奖信息
挂牌上市
版权说明
在线咨询
杂志之家服务支持
发表咨询:400-888-7501
订阅咨询:400-888-7502
期刊咨询服务
服务流程
网站特色
常见问题
工作日 8:00-24:00
7x16小时支持
经营许可
出版物经营许可证
企业营业执照
银行开户许可证
增值电信业务经营许可证
其它
公文范文
期刊知识
期刊咨询
杂志订阅
支付方式
手机阅读