当前位置: 首页 > news >正文

《图像语义分析》学习笔记 (一)

第一章 图像语义分析的基本概念

图像语义,就是图像内容的含义。图像语义可以通过语言来表达,包括自然语言和符号语言(数学语言)。但图像语义并不限于自然语言,其外延对应于人类视觉系统对于图像的所有理解方式。图像语义分析是对图像和图像语义之间的关系进行分析的过程,一般依据已知图像和相应的图像语义的数据库有进行研究,图像和图像语义都可以作为该过程的输入。图像语义分析是模拟人类的认知过程,分析图像中能被人类认知到的含义。图像语义分析的内容主要包括语义体系的构建、图像语义标注、场景分析与理解、图像语义推理等。

图像语义分析的研究方法:

主要分为两种,基于分类的方法(判别模型),基于概率的方法(生成模型)。

判别模型常使用贝叶斯分类器或支持向量机分类器,判别模型还包括人工神经网络。误差反向传播算法(error back propagation, BP)是经典的神经网络训练算法,它的出现掀起了基于统计模型的机器学习的热潮。BP 算法不适于训练具有多隐层单元的深度网络结构,而且由于需要人工构造样本特征不仅需要使用者投入大量的人力物力,还要求使用者对实际问题具有良好的把握,所以该方法的应用面受到限制,其也被称为浅层学习模型。与浅层学习明显不同的深度学习是近年来机器学习研究中最受关注的一个热点,其动机在于模拟、建立人脑进行分析学习的深度神经网络,它模仿人脑的机制来解释图像、声音和文本等数据。它通过将低层的特征组合起来形成更高层的表示,从而发现数据的分布式特征表示。与人工规则构造特征的方法相比,利用大数据来学习特征,刻画数据所示丰富内在信息的能力更强。而且,深度学习可通过学习一种深层非线性网络结构,实现复杂函数逼近,展现出了强大的从少数样本集中学习数据集本质特征的能力。

生成模型通过建立图像与标签之间的概率相关模型进行图像语义分析。一种具有普遍性的语义分类方法,可同时处理目标图像中的多个词汇分类。该方法中,用直方图偶表征图像,一半直方图描述适合图像内容的词汇计数,另一半直方图描述相对于适合图像内容的词汇计数的通用词汇计数。基于概率的图像标注算法,例如,概率潜在语义分析,是一种基于概率的潜在语义分析算法,其基本原理是通过奇异值分解,将文本投影到低维的潜在语义空间中,便可有效地缩小问题的规模。另外,基于相关模型的方法通过构建低层图像特征和图像语义之间的不同相关模型来进行图像语义分析,如跨媒体相关模型(cross-media relevance model, CMRM)、多伯努利相关模型、双跨媒体相关模型等。

图像语义分析的应用

图像语义分析是图像识别、图像标注和图像检索等技术的核心。图像识别技术用于工业机器视觉、光学字符识别、人脸识别和近年兴起的辅助环境感知等。图像标注和图像检索技术一般基于大规模的图像数据库,如基于内容的图像检索(content based image retrieval, CBIR)、基于语义的图像检索(semantics based image retrieval, SBIR)和视频检索等。 

(1)目标识别和解释,应用图像语义分析技术,利用大规模的人脸数据库来提高识别的精度;

(2)基于内容的图像和视频检索;

(3)辅助环境感知,目前辅助环境感知是图像语义分析的前沿应用领域,如汽车的自动驾驶、电子导盲等。

 

 

 


http://www.taodudu.cc/news/show-1944663.html

相关文章:

  • 【physx/wasm】在physx中添加自定义接口并重新编译wasm
  • excel---常用操作
  • Lora训练Windows[笔记]
  • linux基础指令讲解(ls、pwd、cd、touch、mkdir)
  • InnoDB 事务处理机制
  • 启明云端ESP32 C3 模组WT32C3通过 MQTT 连接 AWS
  • 计算机语言语法语义,程序设计语言语义
  • 自然语言处理 4.语义分析
  • 自然语言处理(NLP)语义分析:“词汇级”语义分析【词义消歧、词义表示和学习】、“句子级”语义分析【浅层语义分析(语义角色标注)、深层语义分析】
  • 语义分析的一些方法
  • 语义分析的方法简述之文本基本处理
  • 《图像语义分析》学习笔记 (二)
  • 语义分析的一些方法(一)
  • python 英文语义分析_python语意分析
  • 潜在语义分析(TF-IDF、LSA)
  • NLPIR的语义分析系统
  • 云WAF之语义分析引擎
  • 语义网络与知识图谱
  • 【NLP】语义分析
  • 四、语义分析
  • LTP 语义依存分析
  • python语义网络图_知识图谱之语义网络篇
  • Python实现共现语义网络
  • 基于Python实现语义分析
  • python语义网络图_语义网络 (Knowledge Graph)知识图谱
  • 浅谈语义网络
  • c++ pdflib 中文乱码解决思路
  • PDFlib+PDI图像和超文本元素提供了许多有用的功能
  • PDFLib去水印办法
  • PDFlib使用(c++)
  • PDFLib9以上版本的去水印办法
  • 怎样使用PDFlib显示简体中文输出中文而不出现空白说明附源码
  • c++ pdflib 生成中文内容
  • STM32移植FATFS+USB+FLASH+PDFLIB库总结
  • VS2013配置PDFLib 9.1.2的环境
  • win32,使用PDFlib生成PDF文件