FFMPEG常用命令收集

静态图转BT.709视频

ffmpeg -loop 1 -i colortest_hd.bmp -vf zscale=matrix=709:r=limited,format=yuv420p -color_primaries 1 -color_trc 1 -colorspace 1 -t 30 out2.mp4

-vf zscale=matrix=709:r=limited负责转换色域，否则默认转出来是BT.601之类的SD标准。显式指定limited，因为最新版zimg默认是fullrange了。
- 尽量不要用scale，因为有BUG。具体参见上述Blog文
format=yuv420p负责输出4:2:0的视频
-color_primaries 1 -color_trc 1 -colorspace 1部分负责添加相应的metatag，三者的区别参见Blog文#Color相关章节
- x264的话也可以用-x264opts colorprim=bt709:transfer=bt709:colormatrix=bt709

静态图+音频转视频

ffmpeg -v warning -stats -loop 1 -r 1 -i a.png -i a.wav -r 1 -shortest -fflags shortest -max_interleave_delta 100M -vf zscale=matrix=709:r=limited,format=yuv420p -c:a copy -c:v libx264 -tune stillimage -y aaa.mp4

-v warning -stats: 只显示进度和警告以上的输出。
注意 ffmpeg 分为input和output选项，input选项是在对应的-i前面。* 先输入1（图片），前面的-r 1 来控制input强制1fps读取（否则会把单图重复读取N遍，很慢）；-loop 1保证loop（长度无限）。否则后面的-shortest无效。~~这里吐个槽，不知道为啥我在FFMPEG的文档完全找不到loop的说明…~~ 找到了，在ffmpeg-formats.html § 3.9 image2这个image demuxer的说明里。
再输入2（音频），没有什么要动的。
之后就是输出控制，同样-r 1减少体积。如果考虑到兼容性（比如上传B站），可以改成比较常见的帧率例如30。
-shortest是选择两个输入最短的（即和音频等长，因为图片我们loop了）。但是由于ffmpeg实现的问题（参见bug ticket），只加一个high level的-shortest是不够的，因为容器interleave的原因会出现最终结果比音频长几秒钟的情况，要加这么一大串-shortest -fflags shortest -max_interleave_delta 100M来缓解（参见Gyan的此贴）。但是此法也并不能完全解消除问题。想要完全准确，还是老老实实先获取音频的长度，然后-t吧（-shortest就不用了）。
-vf zscale=matrix=709:r=limited,format=yuv420p的部分原因同上。
编码部分可以自行根据需求调整。

静态图转Full range视频

参见Blog文

ffmpeg -loop 1 -i colortest_hd.bmp -vf zscale=matrix=709:r=full,format=yuvj420p -color_primaries 1 -color_trc 1 -colorspace 1 -t 30 out2.mp4

重点：使用yuvj420p。可以显式加r=full或者r=pc，不过好像加不加没区别，yuvj420p已经imply了。
-color_range 2不要用，效果其实就是强行在元数据里塞个full range，结果视频的像素数值还都是16-235范围内的，也就是说会出来一个灰暗的色域未正常伸张的视频
也有-x264opts fullrange=on，没试过

下载m3u8

(via SU)：

ffmpeg -protocol_whitelist file,http,https,tcp,tls,crypto -i "http://s6.vidshare.tv/hls/pdommq4tlsm4f4kmledsh5d5fcn27i35msjxqw62lfflut5bgaqhb5kirb5q/index-v1-a1.m3u8" -c copy video.mp4

如果m3u8是一个本地文件，前面的-protocol_whitelist的部分是必须的。否则无必要。

合并视频

官方教程

无损stream level合并（比如合并B站分P的）：

(for %i in (*.flv) do @echo file '%i') > mylist.txt
ffmpeg -f concat -safe 0 -i mylist.txt -c copy output.mp4

无损file level合并 (Concat protocol)

合并TS尤其是HLS下载的TS一定要用这种办法而不要一共上述的steam level（事实上h264之类的都可以先封装ts再直接file level合并），否则会在拼接处出现原始流不存在的卡帧现象（据说是timestamps的锅）。

ffmpeg -i "concat:1.ts|2.ts|3.ts" -c copy output.ts

其实可以直接copy：

copy /b 1.ts + 2.ts + 3.ts output.ts

大批量我直接Python：

import shutil

out = open('cat_result.ts','wb')
for f in files: # files is a list of Path obj
    fi = f.open('rb')
    shutil.copyfileobj(fi, out)
    fi.close()
out.close()

如果是直接重编码的合并：

ffmpeg -i input1.mp4 -i input2.webm \
-filter_complex "[0:v:0] [0:a:0] [1:v:0] [1:a:0] concat=n=2:v=1:a=1 [v] [a]" \
-map "[v]" -map "[a]" <encoding options> output.mkv

多文件范例：

ffmpeg -i 001_edit.mkv -i 002_edit.mkv -i 003_edit.mkv -i 004_edit.mkv -i 005_edit.mkv -i 006_edit.mkv -i 007_edit.mkv -filter_complex "[0:v:0] [0:a:0] [1:v:0] [1:a:0] [2:v:0] [2:a:0] [3:v:0] [3:a:0] [4:v:0] [4:a:0] [5:v:0] [5:a:0] [6:v:0] [6:a:0] concat=n=7:v=1:a=1 [v] [a]" -map "[v]" -map "[a]" -c:v libx264 -preset slower -crf 18 -profile:v high -level 5.0 -c:a libvorbis -qscale:a 6 result_final.mp4

切割视频

ffmpeg -i input.mkv -ss 00:00:00 -t 00:04:13.940 -c:v libx264 -preset fast -crf 18 -c:a flac cut.mkv

-t是时长，可以替换为-to，为终止时间戳。

把-ss放在-i前和后是有区别的。先seek（-ss在-i前面）是input seeking，比较快速。否则是output seeking，遇到大文件相当慢（因为要先读取甚至解码(?)整个文件直到seek的时间）。理论上后者更准确，但是据我观察，不同的seeking方法准确度区别并不大。

同理，-to/-t也可以放在-i前后。但是，如果放在之前（自然-ss也得在之前），这个误差就比较大了，据我观察可能有1、2秒之多，基本不可用。

所以，又快速又相对准确的办法理论上应该是-ss xxx -i file -to xxx这个顺序。但是这里有个问题：从output出来，时间戳是会重置回0的，所以-to实际会变成类似-t的效果（ss 20 to 30会变成20~50秒而不是30~30秒）。所以，要加-copyts保持时间戳：-ss xxx -i file -to xxx -copyts才行。

然而，这样也问题：许多TS文件会有内嵌的start time，copyts的话时间戳会受到start time属性干扰，导致切错时间点（参见ffmpeg bug ticket，虽然被关闭了）。

但是-t是不受时间戳的变动影响的：所以-ss xxx -i file -t xxx（不再需要-copyts）依然是准确的。只是，如果想从A时间点切到B，得手动计算下差值了。这里我写了个py脚本帮忙生成命令：

import subprocess
import sys
from pathlib import Path
from django.utils.dateparse import parse_duration

input_file = sys.argv[1]
p = Path(input_file)

p2 = p.with_name(p.stem + ' cut' + p.suffix)
user_input = input('Please input time stamp (press enter to stop")\n')
if user_input == '':
    return
else:
    inputs = user_input.split(' ')
    commands = ['ffmpeg', '-ss', inputs[0], '-i', input_file]
    if len(inputs) == 2:
        t = str(parse_duration(inputs[1]) - parse_duration(inputs[0]))
        commands.extend(['-t', t])
    commands.extend(['-c', 'copy', str(p2)])
    print('Commands is:', ' '.join(commands))
    subprocess.call(commands)

是的，我专门从Django借来了parse_duration来计算时间差。不管你信不信，这么基础的功能我居然找不到别的比较robust的库来处理时间戳…随便找了几个都处理不了几个特殊情况。自己手写情况又太多（比如前导〇、毫秒等等一大堆情况需要处理，懒得折腾。）

开了-c copy同理，但是注意只能关键帧切割，所以准确度会差一些。

制作dummy视频

https://superuser.com/questions/1398756/add-audio-or-video-track-if-not-present-in-input-with-ffmpeg

ffmpeg -f lavfi -i color -f lavfi -i anullsrc -ac 1 -ar 8000 -t 5 dummy.webm
ffmpeg -i input.webm -stream_loop -1 -i dummy.webm -c copy -shortest av.webm

第一行制作一个dummy视频，然后可以用-stream_loop -1来循环。
可以按需加上诸如 -vf scale=1280:720,setsar=1:1 -r 30 之类的。

强制指定keyframe

https://superuser.com/questions/1356862/how-to-add-additional-key-frames-to-video-using-ffmpeg
https://superuser.com/questions/908280/what-is-the-correct-way-to-fix-keyframes-in-ffmpeg-for-dash

我这里测试 -x264-params keyint=20 基本就够了，但是有一些其他的参数见上，可以参考。

显示总帧数

https://stackoverflow.com/questions/2017843/fetch-frame-count-with-ffmpeg

显示关键帧时间戳

https://stackoverflow.com/questions/18085458/checking-keyframe-interval

原文是用awk，我没有，那Python吧……

import json
from subprocess import check_output

input = 'out.ts'
d = check_output(f"ffprobe -loglevel error -select_streams v:0 -show_entries packet=pts_time,flags -of json {input}").decode('ansi')
d = json.loads(d)

for a in d['packets']:
    if 'K' in a['flags']:
        print(a['pts_time'])