读书笔记:如何了解一个新行业—读《碳中和:从绿到金》

周末读《碳中和:从绿到金(2021年第5期)》时候,发现这是一本好书,让大白菜了解了代码之外的另一个世界—碳中和行业发展基本情况、以及该行业龙头企业在做的事情和布局。在读的过程中,有比尔·盖茨写的一篇「气候经济的五大关键问题」文章,里面比尔·盖茨讲的他怎么研究气候变化这一全球性课题的思考方法,讲得特别有启发性,当你试着去了解一个不熟悉行业的时候。 用比尔·盖茨自己的话说,这套思维框架对他大有助益:先试着掌握了整体情况,因为这可以让我获得相关的背景知识,便于我理解新的信息。另

量化索引:Scalar Quantization标量量化

本篇是对之前写过的几篇涉及到向量索引博文的系统整理和补充,分别为: 向量索引 Asymmetry Problem in Computer Vision 再叙ANN Search 十亿规模的深度描述子如何有效索引 基于内容的图像检索技术 背景 在工作中遇到这样一个场景:通过多模态学习到的64维video embedding,在搜索精排的时候,需要实时取到前K(K>=300)个结果对应的video embeddin

视频检索:Videntifier与NV Tree

在视频多帧排序里,大白菜有提到过Videntifier这家做图像、视频检索的公司,在这篇博文里,详细介绍下这家公司以及该公司的主要检索技术。 Videntifier概况 Videntifier科技公司是一家冰岛的软件公司(员工大概17个),成立于2007年9月,该公司起源于雷克雅未克大学的数据库实验室,Herwig Lejsek从2007年到2019年任CEO(卸任后任董事会成员),在博士期间就从事这方面的研究。Videntifier主要构建于两项专利技术——视觉指纹技术

机器视觉:All about Sequence Matching

十年饮冰,难凉热血。 6月22日,在内部分享关于序列匹配一些总结与感想,并以SuperGlue为例,介绍了序列匹配典型方法。对序列匹配感兴趣的同学,可以在这里下载到对应的slides:all-about-sequence-matching-and-alignment-2020622.pdf。

总结回顾:2019年,十年

人一生中最好的机会大多数来自苦拼的经历。苦拼是对人的创造性和个性的考验,你们应该从这些考验中挖掘出最大的价值。 每年年终总结的时候,自己都会重新翻一遍过往写的一些年终总结,同时也会对过去写的一些总结,在保持「历史」事件面貌不变的前提下,对内容文字、结构做一定的修正,并添加自己对个人「历史」的新感受。 2018年,云深不知处 2017年,毕业一周年 2016年,归零清空 2015年,忙碌的一年 2014年,三件小事 从 2009 年背着行李告别父

图像检索:Oxford Building dataset的问题

Oxford Building dataset(后面简称为Oxford)从2007年发布,到2018年Revisiting Oxford and Paris重新整理发布为Revisiting Oxford Building dataset(后面简称为ROxford),整整十年,实例检索(instance retrieval)或物体检索(object retrieval)都跑在一个Ground Truth定义得不是很合理的数据上进行MAP(Mean Average Precis

图像检索:向量索引

本篇是对之前写过的几篇涉及到向量索引博文的系统整理和补充,分别为: Asymmetry Problem in Computer Vision 再叙ANN Search 十亿规模的深度描述子如何有效索引 基于内容的图像检索技术 无论是在学界还是工业界,向量索引是一个研究得比较多的问题,学术上对应的专有名词叫Approximate Nearest Neighbor Search (ANNS),即近似最近邻搜索。为什么是近似,而不是

机器视觉:TensorFlow C++提取特征

深情似海,问相逢初度,是何年纪?依约而今还记取,不是前生夙世。放学花前,题诗石上,春水园亭里。逢君一笑,人间无此欢喜。 无奈苍狗看云,红羊数劫,惘惘休提起。客气渐多真气少,汩没心灵何已。千古声名,百年担负,事事违初意。心头阁住,儿时那种情味。 在实际应用中,将TensorFlow模型推理C++工程化的好处,不仅提升执行效率,保证服务的高可用性,还便于嵌入各类应用框架中。本文主要记录TensorFlow推理过程C++工程化,包含两部分的内容,分别为: TensorF

图像检索:Spreading Vectors for Similarity Search

Thinking in Reverse. Spreading Vectors for Similarity Search是小白菜崇拜的Matthijs Douze和Herve Jegou的作品,发表于ICLR 2019,是一篇对思维方法非常有启发作用的paper,可能会成为利用DNN构建索引方面的经典。这样一篇因为思维的光辉而动人的paper,小白菜很乐意成为它的布道者,并希望借自己的绵薄之力,去传播、应用和改进。 主要思想 Spreading Vectors是逆向思

机器视觉:图像与视频朝向检测

在图片社交、短视频等行业,用户在导入图片、视频的时候,偶尔会导入一些横屏拍摄的视频,使得图片、视频在呈现给用户观看的时候,是旋转了90度或者270度的图片、视频(180度一般极其少见),从而给用户造成不好的体验,特别是以瀑布流方式展示的app。这类视频,由于导入的时候,拿不到原始的拍摄标识信息,从而无法直接取到图像、视频是否旋转的信息,而必须依赖视觉识别的方式,去判断图像、视频是否旋转。 对图像朝向判断问题,学术上研究得比较少,已有的论文主要还是以深度学习分类的方式去检测,