FaceFusion

Industry leading face manipulation platform — 开源人脸替换与增强平台，支持图片和视频处理。

概述

FaceFusion 是一个功能丰富的人脸操作平台，提供人脸替换（face swapping）、人脸增强（face enhancement）、表情编辑、年龄修改、唇形同步等多种处理能力。支持 Web UI 交互模式、命令行 headless 模式和批量作业模式。

项目以 ONNX Runtime 为核心推理引擎，支持多种硬件加速后端（CUDA、TensorRT、DirectML、CoreML、OpenVINO 等），可在 Windows、macOS、Linux 上运行。

架构

核心分层

facefusion.py (入口)
  → core.py (CLI 路由)
    → run → uis/core.py (Gradio Web UI)
    → headless-run → process_headless()
    → batch-run → process_batch()
    → job-* → job_manager / job_runner (作业系统)

关键模块

execution.py — ONNX Runtime 执行 provider 解析与组装（CUDA/TensorRT/DirectML/CoreML/OpenVINO/QNN/CPU）
inference_manager.py — 推理 session 创建、复用和清理
state_manager.py — CLI/UI 运行时状态维护
config.py / facefusion.ini — 启动预设配置
processors/ — 模块化处理器（face_swapper、face_enhancer、age_modifier、lip_syncer 等）
workflows/ — image_to_image、image_to_video 处理流程

推理链路

输入 source（参考人脸）+ target（目标图片/视频）→ 人脸检测（RetinaFace）→ 人脸特征点（2DFAN4）→ 人脸分割（XSeg）→ 处理器执行（swap/enhance 等）→ 输出合成结果

技术栈

层面	技术
推理引擎	ONNX Runtime（多 provider）
加速方案	CUDA、TensorRT（NVIDIA）、DirectML（Windows）、CoreML（macOS）、OpenVINO（Intel）
Web UI	Gradio
视频处理	FFmpeg
音频处理	kim_vocal_2（语音提取）
人脸检测	RetinaFace
人脸特征点	2DFAN4
人脸分割	XSeg 3
配置管理	INI 文件 + CLI 参数
运行环境	Python 3.10+、Miniconda（Windows 原生推荐）