type
status
date
slug
summary
tags
category
icon
password
本文档详细说明了 YouTube Analyzer 系统的完整架构,包含6个可交互的 Mermaid 架构图。
Mermaid 图表在 Notion 中完全可渲染!点击图表可查看大图和详细内容。
1️⃣ 整体架构图
展示了系统的所有组件:数据源、定时任务、核心服务、Discord Bot、HTTP API、AI模型选择、处理流程和数据库。
2️⃣ YouTube 视频处理流程
时序图展示了从定时任务触发到最终保存的完整流程,包括双重字幕获取机制和AI模型选择逻辑。
3️⃣ Blog/Substack 处理流程
RSS feed 解析、AI分析、并行发送到 Discord/Notion/Database 的完整流程。
4️⃣ Discord Bot 交互流程
展示了4种交互场景:右键菜单分析、/analyze 命令、/知识库查询、/演讲分析的完整流程。
5️⃣ AI 模型智能选择逻辑
流程图展示了根据内容语言和是否包含图片自动选择最佳 AI 模型的决策树。
6️⃣ 数据库 Schema (ER 图)
展示了核心数据表及其关系:Video、BlogPost、订阅表、知识库、演讲分析等。
📦 系统组成部分
数据源 (4类)
- YouTube Channels - 15个频道订阅,每日自动检查
- Blog RSS Feeds - 13个博客订阅,每6小时检查
- Substack Publications - 通过RSS,每小时检查
- Notion Database - 手动剪藏的文章,每15分钟检查
核心服务 (8个)
FeedMonitorService- YouTube RSS解析和新视频检测
BlogMonitorService- Blog RSS解析和新文章检测
SubstackService- Substack内容获取
YouTubeService- 视频元数据和字幕获取(youtubei.js + YouTube API双降级)
AIService- OpenRouter AI分析(智能模型选择:GPT-5.1/DeepSeek V3/Gemini 2.5 Pro)
DiscordService- Discord Rich Embed通知(自动拆分长内容)
NotionService- Notion自动发布(Markdown → Blocks转换 + SEO优化)
NotionReaderService- 读取手动剪藏的Notion文章
🛠️ 技术栈
后端框架:Node.js + TypeScript + Express + Prisma
数据存储:PostgreSQL (Neon) + pgvector
AI服务:OpenRouter (GPT-5.1 / DeepSeek V3 / Gemini 2.5 Pro / GPT-4o)
部署平台:Railway (容器化部署 + 自动CI/CD)
✨ 关键特性
- 双重字幕获取机制 - 优先youtubei.js(无API配额) → 降级YouTube Data API
- 智能AI模型选择 - 根据语言和内容类型自动选择最佳模型
- 多渠道内容聚合 - YouTube + Blog RSS + Substack + Notion手动剪藏
- 容错机制 - Discord失败不影响Notion,数据库事务回滚,缓存防重
- SEO优化 - Notion标题优化、自动生成slug、智能tags分类
完整的技术文档和配置说明请查看 GitHub 仓库中的 ARCHITECTURE.md 和 CLAUDE.md 文件。
- Author:EcomGrace
- URL:http://ecomgrace.com/article/youtube-analyzer-architecture-v3
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!


