信息编码方法、系统以及设备技术方案

技术编号:11679510 阅读:66 留言:0更新日期:2015-07-06 12:22
本发明专利技术提供了一种信息编码方法、系统和计算机可读介质。所述方法包括以下步骤:预处理包括用于生成二进制位序列的多个语义句子的文本报文,所述二进制位序列中的每一位对应一个所述语义句子(202);判定所述文本报文适于在其中携带多位代码(203);并且,响应于所述判定将所述代码嵌入所述多个语义句子的子集(204)。

【技术实现步骤摘要】
【国外来华专利技术】信息编码方法、系统以及设备
技术介绍
语义数据是指可以由机器在没有人为干涉的情况下有意义地解读的数据。一般地,语义数据模型是基于已存储符号、或对象,和现实世界间的关系的软件工程模型。数据基于对象的二元模型被组织,通常三部分为一组:两个对象以及所述两个对象间的关系。例如,代表杯子位于桌子上的数据组织可能看起来像“杯子桌子”。对象(即,杯子和桌子)被就其关系来解读,即:位于其上。数据被线性地组织,并且对象展示给软件的位置是:杯子位于桌子上而不是其他方式。相应地,语义数据系统被设计为尽可能准确地代表数据集内的现实世界,并且数据集中的对象被线性地以及分层级地组织来为他们所代表的赋予意义。在云计算环境下中,用于管理、控制通信和其他应用的数据可以与通过网络被传送的一般报文一起被发送。此类数据一般较短,并且离散地附加或嵌入在携带其的报文中。
技术实现思路
在至少一种实施方式中,方法包括预处理包括用于生成二进制位序列的多个语义句子的文本报文,所述二进制位序列中的每一位分别对应所述语义句子中的一个,判定所述文本报文适于在其中携带多位代码,并且响应于所述判定,将所述代码嵌入到所述多个语义句子的子集中。以上概述仅用于说明并且不旨在以任何方式进行限制。除上述说明性的方面、实施方式、以及特征外,通过参考附图以及以下详细描述,另外的方面、实施方式、以及特征将变得显而易见。附图说明结合附图,从以下描述及所附权利要求书,本公开的前述及其他特征将变得更加充分明显。理解的是,这些附图描绘了根据本公开的多个实施方式,并且因此将不被认为限制本公开的范围,通过使用附图,本公开的另外的特性及细节将被描述。图1示出根据本文描述的至少一些实施方式布置的、基于语义数据推理的信息编码的示例方案。图2示出根据本文描述的至少一些实施方式布置的、用于基于语义数据推理的信息编码的处理流程。图3示出根据本文描述的至少一些实施方式布置的、用于基于语义数据推理的信息编码的另一处理流程。图4示出根据本文描述的至少一些实施方式布置的、被配置为执行基于语义数据推理的信息编码的示例系统。图5示出根据本文描述的至少一些实施方式布置的示例计算设备,所述示例计算设备被配置为实施基于语义数据推理的信息编码的一个或多个实施方式的操作。具体实施方式在以下详细描述中,参考附图,附图构成本描述的一部分。在附图中,除非上下文另有指明,否则相同符号一般指代相同部件。另外,除非另有注明,每张连续的附图的描述可以参考一个或多个之前的附图的特征,来提供更清楚的语境以及对当前示例实施方式更为实质性的解释。尽管如此,在详细描述、附图、以及权利要求书中描述的示例实施方式不意在限制。在不背离本文呈现的主题的精神或范围的情况下,其他实施方式可以被使用,并且可以做出其他改变。将很容易理解的是,如本文一般描述的、以及在图中示出的本公开的方面可以以多种不同配置被布置、替换、结合、分离、以及设计,所有这些都在本文被清晰的构思。本文描述的是与基于语义数据推理将代码(code)嵌入文本报文相关的系统、装置、计算机程序产品、方法、以及技术。本文描述的一些示例实施包括通过将所述文本报文分段成多个单独的语义句子来预处理所述文本报文,并且判定所述文本报文是否适于携带数据。当判定所述文本报文适于携带代码(code)时,所述多个语义句子的子集被选择并且所述被选择的子集的语义句子被标记。在语义句子的选择和标记中,包含私有信息的第一知识库被使用。所述代码被嵌入至所述文本报文中,从而通过对所述文本报文的选择的语义句子的选择和标记,对所述文本报文进行编码。所述被编码的文本报文被传送至接收方,所述接收方可以解码所述被编码的文本报文,从而使用所述第一知识库或第二知识库来获得所述代码,所述第二知识库是所述第一知识库的复本。一般地,报文的内容暗含或反映关于信息作者的特定私有信息。例如,一般地,教师可以通过学生对测试问题的回答来判定学生是否已经掌握特定学科。换句话说,由该学生提供的回答反映该学生关于被测试的学科的知识水平。如另一示例,当用户登入系统时,该用户可能被要求回答简短问题,这样对该简短问题的正确回答暗含用户的真实性或身份。当然,此类情境不意在以任何方式进行限制。相反,应当理解的是,在特定报文中暗含的信息可以从所述特定报文的一个或多个语义句子中的每一个被推理或推导出来。假设从语义句子推导结论的结果可以被处理为布尔值(Booleanvalue),与所述语义句子背后的事实一致的推导结论则可以由位值1来代表,并且与所述语义句子背后的事实不一致的推导结论可以由位值0来代表。因此,当所述报文的语义句子中的每一个被推导出与事实一致或不一致的结论时,包含多个语义句子的报文可以被看作并且处理为一系列位值0和1。例如,作为使用公共知识的说明,包含以下三个句子的报文M可以被数学表示为M={0,1,0}:“二月份天数比三月份多。美国有50个州。夏天天气一般比冬天冷。”这是因为第一个句子s1的推导结论与事实不一致,第二个句子s2的推导结论与事实一致,以及第三个句子s3的推导结论与事实不一致。例如,包含特权信息的知识库,如关于报文作者的私有信息,可以被用于判定推导结论是否与各个语义句子背后的事实一致。相应地,当报文具有如下解释的足够大量的多个语义句子时,一个或多个字节的特定代码可以被嵌入或携带入所述报文的选定量的语义句子中。在所述报文中,所述被选择的语义句子按一定序列被选择,这样每个被选择的语义句子的推导结论的位值代表所述一个或多个字节的被嵌入代码的相应位。所述被选择的语义句子被标记,或以其他方式被标记或突出显示,来将其标识为携带所述代码的报文的多个语义句子中被选择的语义句子。所述被编码报文可以被传送至接收方,所述接收方可以使用具有同样特权信息的知识库,并且所述接收方可以通过使用所述知识库恢复所述代码。图1示出根据本文描述的至少一些实施方式布置的、基于语义数据推理的信息编码的示例方案100。根据方案100,在发送侧,报文可以是文本报文,所述文本报文包含一个或多个语义句子并且被编码以携带代码作为被编码报文、使用第一知识库、并且被传送至接收侧。在所述接收侧,第二知识库可以被用来解码所述被编码报文,从而获得原始报文。从数学上讲,所述报文可以被记为M,所述第一知识库可以被记为K,所述代码可以被记为I,以及所述被编码报文可以被记为M’。M={s1,s2,…,si,…},以及si是M的一个或多个语义句子中的任意语义句子。K被用在推导过程中并且si的推导结论可以与各自语义句子背后的事实一致或不一致,分别对应布尔值1和0。I可以被表达为二进位序列,如I=b1b2…bi,,其中bi是I的第i位。例如,当句子s4至s7的推导结论的布尔值反映代码I的四位时,代码I=1101可以被嵌入到所述被编码报文中M’={0,1,0,1,1,0,1,0,0,1}。进一步地,存储在所述第一知识库中的所述特权信息以及存储在第二知识库中的所述特权信息可以相同。在至少一些实施方式中,所述第一知识库和所述第二知识库是可由发送方和接收方访问的同一知识库。在至少一些其他实施方式中,所述第二知识库是所述第一知识库的复本。例如,所述第一知识库和所述第二知识库可以是周期性同步的单独的知识库,这样,存储在所述第一知识库中的本文档来自技高网...
信息编码方法、系统以及设备

【技术保护点】
一种方法,包括:预处理包括用于生成二进制位序列的多个语义句子的文本报文,所述二进制位序列中的每一位分别对应所述多个语义句子中的一个;判定所述文本报文适于在其中携带多位代码;并且响应于所述判定,将所述代码嵌入所述多个语义句子的子集。

【技术特征摘要】
【国外来华专利技术】1.一种信息编码方法,包括:预处理包括用于生成二进制位序列的多个语义句子的文本报文,所述二进制位序列中的每一位分别对应所述多个语义句子中的一个;判定所述文本报文中的所述多个语义句子的数量足够携带代码,其中所述代码包括一个或多个位;选择所述多个语义句子的子集来携带所述代码;将所述代码嵌入所述多个语义句子的所选择的子集中以生成二进制位的模式,其中对应于所述多个语义句子的所选择的子集的所述二进制位的模式与所述代码的所述一个或多个位的模式匹配;以及标记所述多个语义句子的所述所选择的子集。2.如权利要求1所述的方法,其中预处理文本报文包括:将所述文本报文分成所述多个语义句子;并且分析所述多个语义句子以生成所述二进制位序列。3.如权利要求2所述的方法,其中分析所述多个语义句子以生成二进制位序列包括:基于知识库中的信息,当由所述多个语义句子中的一个传达的概念是错误时,生成二进制0;并且基于所述知识库中的所述信息,当由所述多个语义句子中的一个传达的概念为正确时,生成二进制1。4.如权利要求3所述的方法,其中在所述知识库中的信息包括私有信息。5.如权利要求1所述的方法,还包括通过如下操作,判定所述文本报文的语义丰富性足够携带所述代码:比较所述代码和所述二进制位序列;并且判定所述代码的所述一个或多个位能够由所述二进制位序列中对应数量的位来代表。6.如权利要求1所述的方法,其中标记所述多个语义句子的所述所选择的子集包括标记所述多个语义句子的所述所选择的子集,使得对应于所述被标记的语义句子中的每个的所述二进制位指示所述代码的所述位的各个。7.如权利要求1所述的方法,其中对所述多个语义句子的所述所选择的子集标记包括用标签给所述多个语义句子的所述子集中的每个添加前缀。8.如权利要求1所述的方法,进一步地包括:传送嵌有所述代码的所述文本报文。9.如权利要求8所述的方法,其中预处理文本报文包括使用知识库预处理所述文本报文,并且传送所述文本报文包括传送所述文本报文至具有所述知识库的复本的接收方。10.一种信息编码设备,包括:用于将文本报文分成多个语义句子的装置;用于分析所述多个语义句子来生成二进制位序列的装置,其中所述二进制位序列中的每一位分别对应所述多个语义句子中的一个;用于判定所述文本报文中的所述多个语义句子的数量足够携带代码的装置,其中所述代码包括一个或多个位;用于判定所述文本报文的语义丰富度足够携带所述代码的装置;用于选择所述多个语义句子的子集来携带所述代码的装置;用于标记所述多个语义句子的所选择的子集以在所述文本报文中携带所述代码的装置;以及用于传送具有嵌入在所述多个语义句子的被标记的所选择的子集中的代码的所述文本报文的装置,其中对应于所述多个语义句子的被标记的所选择的子集的所述二进制位的模式与所述代码的所述一个或多个位的模式匹配。11.如权利要求10所述的设备,其中用于分析所述多个语义句子以生成二进制位序列的装置包括:用于基于知识库中的信息、当由所述多个语义句子中的一个传达的概念是错误时生成二进制0的装置;以及...

【专利技术属性】
技术研发人员:李达奇方俊
申请(专利权)人:英派尔科技开发有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1