语义理解技术的商业价值

时间:2019-09-08 来源: 历史

排名第一的机器人网络2天前我想分享

人们经常说我们没有做NLP吗?你不是在做关键字模糊查询吗?你做的大公司做得很好。

当我进入这个行业时,我完全无知,无所畏惧。工作了十多年后,我觉得这个行业太难了。

最大的困难是市场,资本和用户不了解语义理解技术的细分。

严格来说,语义理解技术不是计算机科学,而是语言学。机器翻译和搜索是计算机科学。它们不处理语义而只处理文本。例如:“我杀了五个敌人”“衣服干了”,这两点“干”,搜索难以区分。 “吃?”机器翻译总是翻译为“你有吃饭吗”。但结合背景,我们发现“它被吃掉了吗?”可能是“你在吃东西吗?”或者“你吃药吗?”

数学方法在搜索,语音和图像识别以及机器翻译方面的成功使人们相信它可以治愈所有疾病。当人们进入自然语言问答领域的互动时,他们突然发现数学方法不起作用。

有些事情可以用概率来解决,而有些则不能。第二次世界大战期间降落伞的质量非常差,而伞兵往往因降落伞的质量而牺牲。后来,军方的采购部门要求降落伞供应商佩戴其生产的降落伞跳线,以验证产品的质量,降落伞的失效率降至零。自动驾驶仪是一个故障率必须为零的行业。如果发生故障,如果发生故障将导致故障。医疗行业也是一个失败率必须为零的行业。对于故障率必须为零的行业,概率不起作用。

自然语言处理是一个失败率必须为零的行业。你对机器人说“前进三步”,它可能会分四步走。

你对机器人说“将它放入黄色垃圾桶”,将它放入红色垃圾桶时就错了。你对自动驾驶汽车说,“在下一个十字路口右转”,去一个以上的十字路口是不对的。这些错误一旦出错,可能会导致非常严重的事故。你对机器人说“将它放入黄色垃圾桶”,将它放入红色垃圾桶时就错了。你对自动驾驶汽车说,“在下一个十字路口右转”,去一个以上的十字路口是不对的。你对医疗机器人说“为一个8床病人进行子宫切除术”,制作18张病床是错误的。这些错误一旦出错,可能会导致非常严重的事故。

今天的语音交互产品存在这个问题。制造商认为机器可以理解并接受用户语音输入的5%的错误响应率。事实上,这只是制造商一厢情愿的想法。 5%的错误率导致用户增加使用成本,这不是5%,并且用户的痛苦可能被放大几倍。然而,实际上,机器对用户语音交互的错误响应率可能高达20-40%。即使是1%错误的后果也可能非常严重。如果这个错误率不能降到零,业界仍然无法成熟。

解决问题的唯一方法是放弃数学方法并使用语言方法。

为什么我们不能使用数学方法来处理语义?这是因为:

第一:语言的语言不是语义本身。搜索和机器翻译是数学,而不是语言学。搜索和机器翻译处理文本而不是语义。词语只是语言的表达,而语义是语言的本质。人们可以将一种语言翻译成另一种语言,因为它们具有相同的语义。

人们通过语言和文字表达语义,语义处理是通过语言和文字来处理语义。在没有语言之前,人们通过手势,表情,符号和简单的声音来表达他们的意图。这表达的意图与通过该语言表达的意图基本相同。数学家可能不同意我对他们的“指责”。

他们认为他们发明的单词vector和sentence vector是处理语义。数学家无法分辨出“吃药”和“吃药”这两种语义之间的细微差别。他们甚至不考虑语境对句子的影响,他们对“扔什么桶”做了统一的回答。如果这是语义处理,则关键字模糊查询也被认为是语义处理。

虽然语言是语义的载体,但语言本身并不是语义。有时他们是一致的,有时是错位的。这种错位完全超出了数学方法的范围。

第二:数学家不学习语法。他们不是处理语言而是处理数据。离开语法处理语义是不可能的。语言不是一堆语言。汉语有自己的语法特征,英语有自己的语法特征,不同的语言有不同的语法特征。数学家忽略了语法特征的差异,并使用一组算法来处理不同的语言。这违背了语言的规律,是伪科学。

这就像养鱼一样养牛。它可能不会引起奶牛,但它不符合科学规律。事实上,数学家只处理数据,而不是语言。他们的语言处理方法来自处理图像和语音。但语言不是数据,语言是有机体,语言是活生生的,语言是连续的。 “苹果可以吃”,隐藏的语义是“富士苹果可以吃”“秦冠苹果可以吃”“花牛苹果可以吃”等。 “你的苹果电脑给我”中的苹果远不是上面的苹果,也不能吃。判断哪个“苹果”可以吃,哪些不能吃不是一两句,而是一个知识体系。

所以语义处理也是从宏观到微观。一堆单词不能以随机方式表达,只能组织语法规则来准确表达语义。不处理语法只处理文本不是语义处理或伪科学。

例如,使用机器翻译翻译“她死了爹”的结果是“她死于她的父亲”;翻译“酒醉”的结果是“我已经没酒了”; “今天的太阳热死”翻译成“今天的太阳能正在杀人”; “今天的太阳热死”转化为“今天的太阳正在杀戮”。这是由于不分析句子结构而导致的错误。

件反射,而没有智力。以分词为例。 “这是去日本的山东人”分为“是/日/Go///山东”和“是/I/Go///山东”是对的。在什么情况下,将根据具体情况划分什么结果。数学方法给出的分词结果是固定的,不能根据具体情况改变。

件,它是智力(人类智能或人工智能)。自然语言的特点是不完整性,不规则性和不稳定性,而数学家则善于处理完整,标准化和明确的信息,如触摸屏输入和键盘输入。例如,如果用户将“提前”称为“一千美元”,则数学家将其视为“一千美元”,并且语言学家将根据上下文推断用户的意图。

语言学处理语义而不是语言本身。这种情况经常发生在同音词和多义词中。例如,“我们杀死5个敌人”中的“干”通常被视为语音合成,这不是发人深思的,没有智慧。有同音异义词和多义词的规则,不规则表达和虚假陈述会使数学家完全无法找到北方。例如,“我是粥你”,“你在做什么?”,“我不关心你”等等。但通过猜测,你可以理解这些词的意思。

第四:语言中的数据量太大,以至于数学方法无法涵盖这些数据。在处理语义时,获得计算能力就像桉树一样。 Go的董事会共有361分。如果你把一个点想象成一个单词,Go的各种组合大致相当于用361个单词写文章。这些数据量可以用计算能力来覆盖。但是我们有超过50,000个单词。这些50,000个短语你有多少句话?

列出由三个单词组成的所有句子是完全不可能的。基本上不可能使计算机处理像Go这样的语言。当然,它可以在一些极小的领域实现。但如果该领域太小,商业价值可能不会存在。

事实上,我们想到的一些子领域,数据量可能是惊人的。

总之,用数学方法解决语义是不可能的。但是,语义处理恰恰是对错误零容忍的区域。

语言语义理解技术具有重要意义,是一场新的技术革命。当我们的机器开始与我们畅谈时,触摸屏,键盘和鼠标将成为非主流,我们的眼睛和手将被解放,智能可穿戴设备将取代手机和电脑。语言语义理解技术不仅改变了人机交互的方式。它还提高了语音合成和语音识别的准确性,并能有效地处理同音异义和多音节问题。

总之,作为一种革命性的技术,语言语义理解技术具有很大的商业价值。

(作者:迪小机器人CEO彭俊晖)

收集报告投诉

人们经常说我们没有做NLP吗?你不是在做关键字模糊查询吗?你做的大公司做得很好。

当我进入这个行业时,我完全无知,无所畏惧。工作了十多年后,我觉得这个行业太难了。

最大的困难是市场,资本和用户不了解语义理解技术的细分。

严格来说,语义理解技术不是计算机科学,而是语言学。机器翻译和搜索是计算机科学。它们不处理语义而只处理文本。例如:“我杀了五个敌人”“衣服干了”,这两点“干”,搜索难以区分。 “吃?”机器翻译总是翻译为“你有吃饭吗”。但结合背景,我们发现“它被吃掉了吗?”可能是“你在吃东西吗?”或者“你吃药吗?”

数学方法在搜索,语音和图像识别以及机器翻译方面的成功使人们相信它可以治愈所有疾病。当人们进入自然语言问答领域的互动时,他们突然发现数学方法不起作用。

有些事情可以用概率来解决,而有些则不能。第二次世界大战期间降落伞的质量非常差,而伞兵往往因降落伞的质量而牺牲。后来,军方的采购部门要求降落伞供应商佩戴其生产的降落伞跳线,以验证产品的质量,降落伞的失效率降至零。自动驾驶仪是一个故障率必须为零的行业。如果发生故障,如果发生故障将导致故障。医疗行业也是一个失败率必须为零的行业。对于故障率必须为零的行业,概率不起作用。

自然语言处理是一个失败率必须为零的行业。你对机器人说“前进三步”,它可能会分四步走。

你对机器人说“将它放入黄色垃圾桶”,将它放入红色垃圾桶时就错了。你对自动驾驶汽车说,“在下一个十字路口右转”,去一个以上的十字路口是不对的。这些错误一旦出错,可能会导致非常严重的事故。你对机器人说“将它放入黄色垃圾桶”,将它放入红色垃圾桶时就错了。你对自动驾驶汽车说,“在下一个十字路口右转”,去一个以上的十字路口是不对的。你对医疗机器人说“为一个8床病人进行子宫切除术”,制作18张病床是错误的。这些错误一旦出错,可能会导致非常严重的事故。

今天的语音交互产品存在这个问题。制造商认为机器可以理解并接受用户语音输入的5%的错误响应率。事实上,这只是制造商一厢情愿的想法。 5%的错误率导致用户增加使用成本,这不是5%,并且用户的痛苦可能被放大几倍。然而,实际上,机器对用户语音交互的错误响应率可能高达20-40%。即使是1%错误的后果也可能非常严重。如果这个错误率不能降到零,业界仍然无法成熟。

解决问题的唯一方法是放弃数学方法并使用语言方法。

为什么我们不能使用数学方法来处理语义?这是因为:

第一:语言的语言不是语义本身。搜索和机器翻译是数学,而不是语言学。搜索和机器翻译处理文本而不是语义。词语只是语言的表达,而语义是语言的本质。人们可以将一种语言翻译成另一种语言,因为它们具有相同的语义。

人们通过语言和文字表达语义,语义处理是通过语言和文字来处理语义。在没有语言之前,人们通过手势,表情,符号和简单的声音来表达他们的意图。这表达的意图与通过该语言表达的意图基本相同。数学家可能不同意我对他们的“指责”。

他们认为他们发明的单词vector和sentence vector是处理语义。数学家无法分辨出“吃药”和“吃药”这两种语义之间的细微差别。他们甚至不考虑语境对句子的影响,他们对“扔什么桶”做了统一的回答。如果这是语义处理,则关键字模糊查询也被认为是语义处理。

虽然语言是语义的载体,但语言本身并不是语义。有时他们是一致的,有时是错位的。这种错位完全超出了数学方法的范围。

第二:数学家不学习语法。他们不是处理语言而是处理数据。离开语法处理语义是不可能的。语言不是一堆语言。汉语有自己的语法特征,英语有自己的语法特征,不同的语言有不同的语法特征。数学家忽略了语法特征的差异,并使用一组算法来处理不同的语言。这违背了语言的规律,是伪科学。

这就像养鱼一样养牛。它可能不会引起奶牛,但它不符合科学规律。事实上,数学家只处理数据,而不是语言。他们的语言处理方法来自处理图像和语音。但语言不是数据,语言是有机体,语言是活生生的,语言是连续的。 “苹果可以吃”,隐藏的语义是“富士苹果可以吃”“秦冠苹果可以吃”“花牛苹果可以吃”等。 “你的苹果电脑给我”中的苹果远不是上面的苹果,也不能吃。判断哪个“苹果”可以吃,哪些不能吃不是一两句,而是一个知识体系。

所以语义处理也是从宏观到微观。一堆单词不能以随机方式表达,只能组织语法规则来准确表达语义。不处理语法只处理文本不是语义处理或伪科学。

例如,使用机器翻译翻译“她死了爹”的结果是“她死于她的父亲”;翻译“酒醉”的结果是“我已经没酒了”; “今天的太阳热死”翻译成“今天的太阳能正在杀人”; “今天的太阳热死”转化为“今天的太阳正在杀戮”。这是由于不分析句子结构而导致的错误。

件反射,而没有智力。以分词为例。 “这是去日本的山东人”分为“是/日/Go///山东”和“是/I/Go///山东”是对的。在什么情况下,将根据具体情况划分什么结果。数学方法给出的分词结果是固定的,不能根据具体情况改变。

件,它是智力(人类智能或人工智能)。自然语言的特点是不完整性,不规则性和不稳定性,而数学家则善于处理完整,标准化和明确的信息,如触摸屏输入和键盘输入。例如,如果用户将“提前”称为“一千美元”,则数学家将其视为“一千美元”,并且语言学家将根据上下文推断用户的意图。

语言学处理语义而不是语言本身。这种情况经常发生在同音词和多义词中。例如,“我们杀死5个敌人”中的“干”通常被视为语音合成,这不是发人深思的,没有智慧。有同音异义词和多义词的规则,不规则表达和虚假陈述会使数学家完全无法找到北方。例如,“我是粥你”,“你在做什么?”,“我不关心你”等等。但通过猜测,你可以理解这些词的意思。

第四:语言中的数据量太大,以至于数学方法无法涵盖这些数据。在处理语义时,获得计算能力就像桉树一样。 Go的董事会共有361分。如果你把一个点想象成一个单词,Go的各种组合大致相当于用361个单词写文章。这些数据量可以用计算能力来覆盖。但是我们有超过50,000个单词。这些50,000个短语你有多少句话?

列出由三个单词组成的所有句子是完全不可能的。基本上不可能使计算机处理像Go这样的语言。当然,它可以在一些极小的领域实现。但如果该领域太小,商业价值可能不会存在。

事实上,我们想到的一些子领域,数据量可能是惊人的。

总之,用数学方法解决语义是不可能的。但是,语义处理恰恰是对错误零容忍的区域。

语言语义理解技术具有重要意义,是一场新的技术革命。当我们的机器开始与我们畅谈时,触摸屏,键盘和鼠标将成为非主流,我们的眼睛和手将被解放,智能可穿戴设备将取代手机和电脑。语言语义理解技术不仅改变了人机交互的方式。它还提高了语音合成和语音识别的准确性,并能有效地处理同音异义和多音节问题。

总之,作为一种革命性的技术,语言语义理解技术具有很大的商业价值。

(作者:迪小机器人CEO彭俊晖)

频道热点
  1. 在我们平常的生活中,蔬菜一直是我们餐桌上不可或缺的成分,也是餐桌上最高的食物。即使你吃饱了,如果你不
  2. )香港的暴力事件不断升级。这些暴徒“组织良好,训练有素”,向警察投掷不明物体,使用激光笔等高度回避但
  3. )香港的暴力事件不断升级。这些暴徒“组织良好,训练有素”,向警察投掷不明物体,使用激光笔等高度回避但
  4. 在我们平常的生活中,蔬菜一直是我们餐桌上不可或缺的成分,也是餐桌上最高的食物。即使你吃饱了,如果你不
  5. )香港的暴力事件不断升级。这些暴徒“组织良好,训练有素”,向警察投掷不明物体,使用激光笔等高度回避但
  6. 李胜说,4天前,我想和大家分享,我担心自己会活得太好。一切都可以区分是非,并区分成功的可能性。只是所?
  7. 昨天的城市场景我想分享来源|城市频道整合广西新闻如果您重印,请注明所有来源8月11日晚8点左右,一名民警?
  8. )香港的暴力事件不断升级。这些暴徒“组织良好,训练有素”,向警察投掷不明物体,使用激光笔等高度回避但
  9. 原来热闹的地平线,我想昨天分享找到板凳大师,估计这可以做成锤子。这是送花,用毛巾洗澡看到这里的日子,我觉得我去了一个假西藏小女孩上幼儿园几天,给了我们一个模拟老师讲课我小时候常常抓青蛙。现在,我的孩
  10. 今年夏天,朋友圈中的女孩的“男孩”之后是一波浪潮不是那些被戏剧追逐的人,而是三个疯狂的三声电话:李光
新闻排行
  1. 关于圈子中的演员最令人担忧的是他们将被故意作为目标。担心有些人嫉妒超快的进步速度,他们会发现问题所在

    关于圈子中的演员最令人担忧的是他们将被故意作为目标。担心有些人嫉妒超快的进步速度,他们会发现问题所在...

  2. 关于圈子中的演员最令人担忧的是他们将被故意作为目标。担心有些人嫉妒超快的进步速度,他们会发现问题所在

    关于圈子中的演员最令人担忧的是他们将被故意作为目标。担心有些人嫉妒超快的进步速度,他们会发现问题所在...

  3. )香港的暴力事件不断升级。这些暴徒“组织良好,训练有素”,向警察投掷不明物体,使用激光笔等高度回避但

    )香港的暴力事件不断升级。这些暴徒“组织良好,训练有素”,向警察投掷不明物体,使用激光笔等高度回避但...

  4.   亲宝贝2天前我要分享      真正可怕的,是来自不经意间的恶。    『end』    往期精彩回

      亲宝贝2天前我要分享      真正可怕的,是来自不经意间的恶。    『end』    往期精彩回...

  5. )香港的暴力事件不断升级。这些暴徒“组织良好,训练有素”,向警察投掷不明物体,使用激光笔等高度回避但

    )香港的暴力事件不断升级。这些暴徒“组织良好,训练有素”,向警察投掷不明物体,使用激光笔等高度回避但...

  6. 我必须在4天前分享这辆车路上的旅程,但驾驶摩托车时,不仅车主有一定的驾驶技术,而且文件齐全,最重要的?

    我必须在4天前分享这辆车路上的旅程,但驾驶摩托车时,不仅车主有一定的驾驶技术,而且文件齐全,最重要的?...

  7.   亲宝贝2天前我要分享      真正可怕的,是来自不经意间的恶。    『end』    往期精彩回

      亲宝贝2天前我要分享      真正可怕的,是来自不经意间的恶。    『end』    往期精彩回...

  8. 文/请爸爸妈妈!富人,但孩子们不再与自己相处;为孩子们抱着好盾,努力不回家.这些情节似乎对我们很熟悉,?

    文/请爸爸妈妈!富人,但孩子们不再与自己相处;为孩子们抱着好盾,努力不回家.这些情节似乎对我们很熟悉,?...

  9.   7月火的一塌糊涂的松糕拖鞋,时髦又好走,关键还不昂贵夏季新款坡跟拖鞋女式高跟平台舒适又有预防性。?

      7月火的一塌糊涂的松糕拖鞋,时髦又好走,关键还不昂贵夏季新款坡跟拖鞋女式高跟平台舒适又有预防性。?...

  10. 12:52:15小易十二生肖属。相猪虽然猪女孩并不是人群中最明显和最突出的,但是小女人风格的猪女孩,很多女孩都无法学习。它属于猪女,看上去很美,浪漫的梦想,温暖大方,再加上林黛玉的自然气质,温柔,敏

    12:52:15小易十二生肖属。相猪虽然猪女孩并不是人群中最明显和最突出的,但是小女人风格的猪女孩,很多女孩都无法学习。它属于猪女,看上去很美,浪漫的梦想,温暖大方,再加上林黛玉的自然气质,温柔,敏...