不记得到底在多少个地方看见过过这个词 - resampling, 中文有时候翻译为重采样,也就是字面意思重新采样。

  • MATLAB

记忆中,大概第一次看见这个词汇,是在数学建模比赛的时候,使用MATLAB中有这么一个函数:https://www.mathworks.com/help/signal/ref/resample.html “Resample uniform or nonuniform data to new fixed rate”,也就是说按照某种过滤规则重新进行采样

  • pandas

同样,在做数据分析时候,pandas的dataframe和Series中,可以使用resample对数据进行扩大或者缩小,按指定的规则https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.resample.html

  • 数字信号处理

曾经有段时间做数据信号处理项目的时候,小伙伴们对我解释过采样,是按照某种时间间隔固定采样,对信号进行内插,扩大信号量是为上采样 (upsampling), 对信号进行抽取呢就是下采样(downsampling), 下采样还要防止频谱混叠,进行滤波处理。

  • 图像处理

提到滤波处理,就想起来原来做图像处理的时候,有会学习到很多跟波相关的知识,什么小波啊,滤波啊。可惜,在图像这条路上,总是遇到各种各样的事情,对不起冈萨雷斯,也对不起一位对我寄托厚望的学长了。图像上,有一个简单的采样,放大图片的时候(zoom-in),需要更清晰的局部图片,就要加载更多的像素点,那这就是上采样,那缩小图片呢,单位面积需要展示的像素点就小了(zoom-out),也就是下采样.

  • OpenTSDB

而在做monitor的时候,grafana支持多种数据结构,第一知道了原来时序数据库有这么多,什么influxdb, OpenTSDB,Graphite ,(这里有个时序数据库排行https://db-engines.com/en/ranking/time+series+dbms),做技术调研的时候发现,grafana对opentsdb和influxdb支持的编辑面板不一样,OpenTSDB还有Downsampling,http://opentsdb.net/docs/build/html/user_guide/query/downsampling.html,当然,最后决定用grafana才不是因为想远离hadoop系呢,spark还用过一段时间呢。

  • CNN

而最近,就是在CNN中接触的下采样层,不过这里可不是downsampling这个词,而是down-pooling,其实应该是池化层,只是池化的卷积核只取几个值,并且不经过反向传播的修改,防止局部拟合,以提高精度,降低维度的同时还避免过拟合。

说白了就是sampling resampling downsampling upsampling这几个词反反复复出现,越发的有一种感觉,数学拯救世界,那为什么最后数学家往往哲学和神学兼修呢?

记录一下,若有新发现,继续append。


转载请注明来源,https://blog.vicyu.com
由于水平有限,行文难免出错,恳请读者批评指正。