Latent Dirichlet Allocation(LDA) [pdf]模型是近年来提出的一种具有文本主题表示能力的非监督学习模型。
关键所在:it posits that each document is a mixture of a small number of topics and that each word's creation is attributable to one of the document's topics。
将文档看成是一组主题的混合,词有分配到每个主题的概率。
Probabilistic latent semantic analysis(PLSA) LDA可以看成是服 从贝叶斯分布的PLSA
LDA,就是将原来向量空间的词的维度转变为Topic的维度,这一点是十分有意义的。
例如,...
Image Annotation, Image Retrieval, LDA, 信息检索, 图像分类, 图像标注, 多媒体检索, 文本分类阅读全文
熵(entropy)指的是体系的混乱的程度,它在控制论、概率论、数论、天体物理、生命科学等领域都有重要应用,在不同的学科中也有引申出的更为具体的 定义,是各领域十分重要的参量。熵由鲁道夫·克劳修斯(Rudolf Clausius)提出,并应用在热力学中。后来在,克劳德·艾尔伍德·香农(Claude Elwood Shannon)第一次将熵的概念引入到信息论中来。
图像熵表示为图像灰度级集合的比特平均数,单位比特/像素,也描述了图像信源的平均信息量。
: H(p)=-∑i,jp(i.j)lnp(i,j), 其中p(i,j)=x(i,j)∑i,jx(i,j),x(i,j)为图像的像...
ACM, 图像处理, 图像检索, 图像熵, 多媒体检索, 熵阅读全文
Google Image Swirl是Google Labs里针对图片搜索的又一实验项目,它好像是将之前寻找相似图片的功能,与Search Options(搜索百宝箱)里的Wonder wheel(神奇罗盘)进行混搭。
比如在Image Swirl里搜索紫禁城先得到如上图的结果,基本上呈现出不同类型的紫禁城图片,如果你对某一类很感兴趣,那么可以继续点击其图片,深入探索,一次一次一直进行下去,如下图。
访问:Google Image Swirl
Image Swirl采用了为Similar Images和Picasa脸部识别开发的两个技术,来识别相似的图片,将他们归为一类,再利用...
CBIR, WEB, 信息检索, 分类, 多媒体检索, 机器学习, 聚类阅读全文
刘铁岩博士,现任微软亚洲研究院研究项目主管(lead researcher)。他是排序学习领域的知名专家,已在国际顶级期刊和会议上发表相关论文70余篇。他著有专著《信息检索中的排序学习问题》和《高阶异构数据挖掘》。他持有50余项美国专利或申请。他的论文曾获得国际信息检索大会(SIGIR)最佳学生论文奖,和国际期刊《视觉通信和图像表示》的最高引用论文奖。他是国际计算机辅助搜索会议(RIAO) 2010年度的程序委员会主席,国际信息检索大会(SIGIR)2008和2009年度的领域主席(Area Chair),亚洲信息检索会议(AIRS) 2009年度...
Rank, 刘铁岩, 图像检索, 图像聚类, 多媒体检索, 微软亚洲研究院, 排序, 机器学习, 视频处理阅读全文








最新评论
-鼠标画图用inkspace
我也不小了,研一,正准备g呢
我也准备出去读phd,交个朋
单纯支持一下
有没有摄影博客推荐啊?
别光想着父母啊,我也需要陪啊
xixi
今天在电台上听到了,女主持人
学校有专门的tex模板, 本
喜欢,分享了!