鸿 网 互 联 www.68idc.cn

当前位置 : 主页 > 编程语言开发 > c++ > >

Flv的结构分析

来源:互联网 作者:佚名 时间:2018-02-06 18:04
Flv是网络上流行的非常广的一种媒体格式,很多大型媒体网站都在使用这种格式承载音视频信息,比如优酷等网站。 Flv文件格式相对而言还是比较简单的,主要是由两部分组成 FLV header FLV body FLV header 前9个字节 46 4c 56 01 05 00 00 00 00 09 第一到第三

Flv是网络上流行的非常广的一种媒体格式,很多大型媒体网站都在使用这种格式承载音视频信息,比如优酷等网站。

   

Flv文件格式相对而言还是比较简单的,主要是由两部分组成

   

FLV header

FLV body

   

   

FLV header

   

前9个字节

46 4c 56 01 05 00 00 00 00 09

第一到第三字节(46 4c 56) 的ascii的代码为"FLV"(注意大小写)

第四个字节为版本信息,一般都为(01)

第五个字节为流的信息,表示是否有视频信息,是否有音频信息。0000 0001(0x01)为有视频,0000 0100(0x04)为有音频,既有有视频又有音频为(0x05)

第六到第九字节存放的是整个头部长度,一般为(3+1+1+4)=9。

   

FLV body

   

Flv body是由很多tag组成,tag又分成三种类型

  • script(脚本流)
  • video(视频流)
  • audio(音频流)

   

tag的结构举例如下:

   

   

每个tag包含

  • tag header
  • tag data

       

tag header

   

tag header 的第一个字节表示为记录的数据类型,(0x12)为脚本类型;(0x08)为音频类型;(0x09)为视频类型    

tag header的第二到第四个字节表示为数据区长度

(0x00 01 74)表示 为372,表示tag data 长度

tag header 的第五到第七个字节表示为时间戳,类型为(0x12)的tag时间戳一直为0,(0xFFFFFF)可以表示长度为4小时,单位为毫秒。

tag header 的第八个字节为扩展时间戳,一般都为0,长度为4小时的flv一般很少见了。

tag header 的第九到第十一个字节为streamID,总为0.

   

tag data

   

tag data三种类型的结构表示如下:

script(脚本流)

包含两个AMF(Action Message Format)包,第一个AMF包封装了" onMetaData ",第二个AMF包封装了诸如视频图像长宽,文件长度,视频帧率,音频比特率,位深等等。

第一个字节表示AMF包类型,都是(0x02),表示字符串。

第二到第三个字节表示字符串长度,一般是(0x0a),表示10个字符串,就是第四到第十三个字节包含的" onMetaData "字符串的长度。

第十四个字节是第二个AMF包类型,一般是(0x08),表示数组,第十五到第十八个字节是AMF包长度,表示数组元素个数。(0x10)表示包含16个数组元素长度。

后面即为各数组元素的封装,数组元素为元素名称和值组成的对。表示方法如下:

   

第1-2个字节表示元素名称的长度,假设为L。

后面跟着为长度为L的字符串。

第L+3个字节表示元素值的类型。

后面跟着为对应值,占用字节数取决于值的类型。

   

   

video(视频流)

   

视频流如下:

前4bits表示类型:

·1-- keyframe

·2 -- inner frame

·3 -- disposable inner frame (h.263 only)

·4 -- generated keyframe

(0x17)前4bit表示为0001,表示为keyframe

   

后4bits表示解码器ID:

·2 -- seronson h.263

·3 -- screen video

·4 -- On2 VP6

·5 -- On2 VP6 with alpha channel

·6 -- Screen video version 2

·7 -- AVC (h.264)

(0x17)后4bits表示为0111,表示为avc(h.264)

   

第二个字节固定为0x01。

 

之后是视频数据。

   

   

audio(音频流)

前4bits表示音频格式:

·0 -- 未压缩

·1 -- ADPCM

·2 -- MP3

·4 -- Nellymoser 16-kHz mono

·5 -- Nellymoser 8-kHz mono

·10 – AAC

(0x2b)前4bits为2,表示为mp3

   

下面两个bits表示samplerate:

·0 -- 5.5KHz

·1 -- 11kHz

·2 -- 22kHz

·3 -- 44kHz

(0x2b)中b表示为 1011,10为2,表示22kHz

   

下面1bit表示采样长度:

·0 -- snd8Bit

·1 -- snd16Bit

   

   

下面1bit表示类型:

·0 -- sndMomo

·1 – sndStereo

   

之后是数据。

   

tag size

在每个tag前面都有四个字节,表示前面tag的长度大小,因为script(脚本流)前面没有tag,所以script tag前面的四个字节都为(0x00 00 00 00).

 

相应的入门代码 传送门:

上一篇:Baker Vai LightOJ - 1071
下一篇:没有了
网友评论
<