剪映字幕导出神器：用Python脚本一键提取视频字幕文本（附完整代码）

最新推荐文章于 2026-05-07 08:32:06 发布

原创

最新推荐文章于 2026-05-07 08:32:06 发布 · 812 阅读

标签

#剪映 #Python #字幕提取 #JSON解析

剪映字幕高效提取：Python自动化脚本实战与进阶应用

如果你经常用剪映制作视频，尤其是需要处理大量课程录像、访谈内容或者自媒体素材，肯定对它的“智能字幕”功能又爱又恨。爱的是，它的识别准确率确实很高，大大节省了手动输入的时间；恨的是，当你想把这些识别好的字幕文本导出，用于制作逐字稿、文章或者二次编辑时，只能一条条手动复制粘贴，面对几十分钟的视频，这简直是场噩梦。

我最初也深受其扰，直到我发现剪映其实把所有的字幕信息，都悄悄地保存在了一个JSON文件里。这意味着，我们完全可以用程序来“读取”这个文件，把里面的文本自动“拿”出来。今天，我就来分享一套我自己打磨了许久的Python解决方案，它不仅能一键提取，还包含了很多处理实际复杂情况的经验和技巧，比如处理多段字幕、合并时间线、导出为多种格式等。无论你是Python新手，还是有一定经验的开发者，这篇文章都能让你获得一个即拿即用的生产力工具。

1. 核心原理：剪映字幕数据的藏身之处

要自动化，首先得知道数据在哪。剪映在完成字幕识别后，会将整个项目（包括视频、音频、字幕、特效等所有信息）保存为一个“草稿”。这个草稿本质上是一个文件夹，里面包含了若干配置文件和素材。

当你关闭剪映时，它会自动保存当前项目。下次打开剪映，在主页的草稿缩略图右上角，通常会有一个“菜单”或“信息”图标，点击后能找到“在资源管理器中打开”或类似选项。点击它，系统就会直接打开这个草稿所在的文件夹。

在这个文件夹里，你会看到类似这样的结构：

你的草稿名称.draft/
├── draft_content.json
├── draft_meta_info.json
├── materials/
└── ...

我们需要的所有字幕文本，就完整地存储在 draft_content.json 这个文件里。这是一个结构化的JSON文件，我们可以像读一本有目录的书一样，用程序精准地找到字幕所在的那一页。

为什么选择解析JSON，而不是用语音识别API？

这是一个很实际的问题。市面上有很多语音转文本的API服务，但通常有以下几个痛点：

成本：大多按时长收费，处理大量视频时费用不菲。
准确率：对于带口音、专业术语或嘈杂环境的音频，准确率难以保证。
流程繁琐：需要上传音频、等待处理、下载结果，步骤较多。

而剪映的离线识别（尤其是专业版）基于强大的本地模型，准确率高，且完全免费。我们解析JSON，只是把剪映已经做好的工作成果“搬运”出来，是一个典型的“站在巨人肩膀上”的增效方法。

注意：不同版本的剪映（如移动端、桌面端、专业版）生成的JSON结构可能略有差异。本文主要针对剪映专业版（JianyingPro） 的桌面版本，其结构最为稳定和清晰。其他版本的思路相通，但具体字段路径可能需要微调。

2. 基础实战：编写你的第一个提取脚本

让我们从一个最核心、最简单的脚本开始。请确保你的电脑上已经安装了Python（3.6及以上版本均可）。

首先，找到你的剪映草稿文件夹，将里面的 draft_content.json 文件复制到一个方便操作的新目录，例如 D:\subtitles_extract。然后，在该目录下创建一个新的Python文件，命名为 extract_subtitles_basic.py。

打开这个Python文件，我们开始编写代码。

import json
import os

def extract_subtitles_basic(json_file_path):
    """
    基础版本的字幕提取函数。
    从剪映的draft_content.json中提取纯文本字幕。
    
    参数:
        json_file_path (str): draft_content.json文件的完整路径。
    
    返回:
        list: 一个包含所有字幕文本字符串的列表。
    """
    subtitles_list = []
    
    try:
        with open(json_file_path, 'r', encoding='utf-8') as f:
            data = json.load(f)
    except FileNotFoundError:
        print(f"错误：找不到文件 {json_file_path}")
        return subtitles_list
    except json.JSONDecodeError:
        print("错误：文件不是有效的JSON格式。")
        return subtitles_list
    
    # 核心解析逻辑：导航到字幕数据所在的位置
    # 结构通常是：data -> tracks -> [多个轨道] -> segments -> [多个片段] -> content
    # 我们需要找到类型为‘text’的轨道（track）
    tracks = data.get("tracks", [])
    
    for track in tracks:
        # 检查轨道类型是否为‘text’（字幕轨道）
        if track.get("type") == "text":
            segments = track.get("segments", [])
            for segment in segments:
                # 每个segment的‘content’字段里存放着字幕文本（可能包含富文本格式）
                content = segment.get("content", "")
                if content:
                    # 这里得到的内容可能包含XML/HTML标签，我们先简单处理，后续会优化
                    # 例如: ‘<font ...>你好世界</font>’
                    # 我们先直接添加到列表，清洗工作放在另一个函数
                    subtitles_list.append(content)
    
    return subtitles_list

if __name__ == "__main__":
    # 假设json文件与脚本在同一目录下
    current_dir = os.path.dirname(os.path.abspath(__file__)

最低0.47元/天解锁文章