最开始接触图片隐写信息,是听到一种“图种”的东西。所谓“图种”,始于某些资源分享网站,把要分享的什么ed2k链接、bt种子、磁力链接等,弄成一个zip压缩包,然后将这个压缩包的二进制数据附加到一个jpg图片后面,得到一张新jpg图片,新图片就是图种。
有人可能会疑惑,改变了图片的二进制数据,图片还能正常显示吗?实际上jpg格式图片,其二进制数据是有结束符的。这个结束符的16进制表示就是FF D9
。用winhex
工具打开正常的jpg图片,它的结束符都是FF D9
。一般的图片查看器,会自动忽略结束符jpg图片结束符后的内容,所以,你在后面附加了一个压缩包文件的二进制值数据,不会影响图片正常显示。
制作一个图种,方法很简单,如果你在windows下操作,可以利用cmd工具,通过命令copy /b 1.jpg+2.zip output.jpg
,得到的output.jpg
就是图种。同样,在linux/mac下,命令就是cat 1.jpg 2.zip > output.jpg
。这样,你把output.jpg
分享出去,别人把这图片下载到本地,将文件后缀名改成zip
,就可以解压出来得到1.jpg
和2.zip
了。
图种是在图片上增加数据达到隐藏数据的目的,还有一种修改图片数据的方式也可实现。一种常见的方式是利用LSB来进行隐写,LSB也就是最低有效位 (Least Significant Bit)。其原理:图片是由一个个像素组成的,每个像素由一组(r,g,b)值表示(png格式图片,多一个alpha透明度值)。而对于单个r,g或b,其范围在0~255之间,可由一个字节(8位表示)。因此,当改变最低位的值时,对于整个图片来说,其视觉效果通过肉眼看不出来的。比如一组颜色白色(255,255,255),变为(254,255,255)时,是看不出来变化的。因此,可将一组待隐藏信息转换为二进制后,再将每个二进制码存储在图片的像素中。
下面我们来实现下在图片中隐藏文本和提取隐藏文本的过程:
隐藏文本步骤
•获取原图片像素(list)•使像素最低位变为偶数•待隐藏信息转换为二进制,并且对于单字节字符,当位数不够8时,在最高位补0•将二进制的待隐藏信息依次与图片中每个像素的r、g、b进行相加
提取隐藏文本步骤
•获取隐藏有信息的图片的像素(list)•获取像素值的最低位(隐藏的信息存储位置)•获取存储的信息的二进制值•按每8位为一组,将上述二进制转换为十进制形式•采用chr函数,将十进制转为字符并存储到字符串中
#!/usr/local/bin/python3
from PIL import Image
def makeImageEven(image):
"""
取得一个 PIL 图像并且更改所有值为偶数(使最低有效位为 0)
"""
pixels = list(image.getdata()) # [(r,g,b,t),(r,g,b,t)...]
evenPixels = [(r>>1<<1, g>>1<<1, b>>1<<1, t>>1<<1) for [r,g,b,t] in pixels] # 更改所有值为偶数, 移位
evenImage = Image.new(image.mode, image.size) # 创建一个相同大小的图片副本
evenImage.putdata(evenPixels) # 把上面的像素放入到图片副本
return evenImage
def constLenBin(int):
"""
内置函数 bin() 的替代,返回固定长度的二进制字符串
"""
binary = "0"*(8-(len(bin(int))-2))+bin(int).replace('0b','') # 去掉 bin() 返回的二进制字符串中的 '0b',并在左边补足 '0' 直到字符串长度为 8
return binary
def encodeDataInImage(image, data):
"""
将字符串编码到图片中
"""
evenImage = makeImageEven(image) # 获得最低有效位为 0 的图片副本
binary = ''.join(map(constLenBin, bytearray(data, 'utf-8'))) # 将需要被隐藏的字符串转换成二进制字符串
if len(binary) > len(image.getdata()) * 4: # 如果不可能编码全部数据, 抛出异常
raise Exception("Error: Can't encode more than " + len(evenImage.getdata()) * 4 + " bits in this image. ")
encodedPixels = [(r+int(binary[index*4+0]),g+int(binary[index*4+1]),b+int(binary[index*4+2]),t+int(binary[index*4+3])) if index*4 < len(binary) else (r,g,b,t) for index,(r,g,b,t) in enumerate(list(evenImage.getdata()))] # 将 binary 中的二进制字符串信息编码进像素里
encodedImage = Image.new(evenImage.mode, evenImage.size) # 创建新图片以存放编码后的像素
encodedImage.putdata(encodedPixels) # 添加编码后的数据
return encodedImage
def binaryToString(binary):
"""
从二进制字符串转为 UTF-8 字符串
"""
index = 0
string = []
fun = lambda x, i: x[0:8]
while index + 1 < len(binary):
chartype = binary[index:].index('0') # 存放字符所占字节数,一个字节的字符会存为 0
if chartype == 0:
chartype = 1
length = chartype * 8
for i in range(chartype):
ascode = int(binary[index+i*8:index+i*8+8],2)
string.append(chr(ascode))
index += length
return ''.join(string)
def decodeImage(image):
"""
解码隐藏数据
"""
pixels = list(image.getdata()) # 获得像素列表
binary = ''.join([str(int(r>>1<<1!=r))+str(int(g>>1<<1!=g))+str(int(b>>1<<1!=b))+str(int(t>>1<<1!=t)) for (r,g,b,t) in pixels]) # 提取图片中所有最低有效位中的数据
# 找到数据截止处的索引
locationDoubleNull = binary.find('0000000000000000')
endIndex = locationDoubleNull+(8-(locationDoubleNull % 8)) if locationDoubleNull%8 != 0 else locationDoubleNull
data = binaryToString(binary[0:endIndex])
return data
if __name__ == '__main__':
#隐藏信息
encodeDataInImage(Image.open('1.png'), 'hello, world').save('encodeImage.png')
#读取信息
b = decodeImage(Image.open("encodeImage.png"))
print(b)
在这个过程中,我们要注意到,隐写的载体是PNG的格式,如果是像之前的jpg图片的话就是不行的,原因是jpg图片对像数进行了有损的压缩,你修改的信息可能会被压缩的过程破坏。而PNG图片虽然也有压缩,但却是无损的压缩,这样子可以保持你修改的信息得到正确的表达,不至于丢失。BMP的图片也是一样的,是没有经过压缩的,可以发现BMP图片是特别的大的,因为BMP把所有的像数都按原样储存,没有压缩的过程。