这是CS50的第四次大作业,顺便学习了图像的入门知识。 ## 基础
黑白图(bitmap)的每个像素点只能取值0/1,1代表白色,0代表黑色。
常见的图片格式有JPEG/PNG/BMP,这些格式都支持RGB,每个像素点可以用多个bit表示,常见的是24-bit,红、绿、蓝分别由8bit表示,范围0~255。
BMP图的开始位置有两个header,第一个叫BITMAPFILEHEADER
,14B;第二个叫BITMAPINFOHEADER
,40B。接下来的每个像素点是按照BGR的顺序存储的。
过滤器
Image Filter就是对原图的像素点的像素进行操作,得到一幅新图。主要有下面几种:
- Grayscale
将RGB图变为灰度图。将每个像素点的R/G/B的值改为相同,值越大,亮度越大。一般取三色的平均值。 - Sepia
比较像怀旧滤镜,有很多算法可以做,主要就是对3种颜色乘一些系数,做一些加减运算。 - Reflection
左右翻转。 - Blur
图像模糊,对每个像素点的每种颜色,取其周围3*3格子的平均值。 - Edges
边缘检测,可以用Sobel Operator去做:
Blur是对周围的格子取平均,Sobel是求一个加权和,对于x和y方向,有两个kernel:
对每个像素点的每种颜色,用周围3*3格子的对应颜色分别去乘Gx/Gy,得到加权和sumx/sumy。
以x为例,如果左右两边差不多,那么加权和接近0,否则得到一个大正数/负数,说明很有可能是两个物体的分界。
综合考虑x和y方向,取\(\sqrt{sumx^2+sumy^2}\),再四舍五入到0~255之间。
对于边缘的格子,可以做padding,围一圈全黑(0)的格子,相当于不用计算。
图片恢复
JPEG的前三个字节分别是0xff, 0xd8, 0xff
,第四个字节的前四位是1110
,这些可以唯一标识JPEG文件。
记忆卡上所有图片是连续存储的,最小单位每块512B,不到一块的后面补0,不影响显示,每张图片可能占若干块。
可以每次读512B扔到buffer里,如果是jpeg,就将其写入新文件、继续读512B,直到遇到下一个jpeg。