×
LECTURE · 2026

人工智能技术与产业融合发展现状

AI浪潮下传媒行业发展态势——从Token经济到智媒转型

媒体工程学院 张赟
2026年7月5日
logo

讲座导览

本讲座共分为七个章节,系统梳理AI技术基础、产业格局、传媒行业融合实践与AI案例专题

01
AI基础概念:从Token到算力
用生活化的比喻,拆解人工智能的核心术语
02
国内大模型生态格局
2026年最新版"百模大战"全景图
03
Token经济:商业模式与成本逻辑
从"算力消耗"到"Token结算"的价值重构
04
AI浪潮下传媒行业变革
从内容生产到传播分发的全链路重塑
05
出版行业的AI应用实践
从图书编辑到知识服务的全链路升级
06
从业者的机遇与挑战
传媒人如何在AI时代保持不可替代性
07
AI案例专题:意图即代码
非技术者的AI协作共创与验证方法
CHAPTER 01

01 AI基础概念:从Token到算力

用生活化的比喻,拆解人工智能的核心术语。在深入行业应用之前,先用简单易懂的类比讲清大模型、Token、Agent、算力等概念,为零技术背景的从业者扫清认知障碍。

大模型:一个读过全人类图书馆的"超级实习生"

核心类比:大模型就像一个"超级实习生"——读过海量文本,能回答问题、写文章、做翻译,但也会犯错。GPT-4、文心一言是典型代表。

能做什么
  • 回答问题:从专业知识到日常咨询,覆盖多领域
  • 写文章:新闻稿、报告、创意文案,支持多种风格
  • 做翻译:多语言互译与本地化,支持100+语言
  • 总结长文档:快速提取要点、生成结构化摘要
  • 写代码:编程辅助、调试与算法优化
能力边界
  • 无法保证100%准确:可能产生"幻觉"信息
  • 不理解物理世界:缺乏常识与感知能力
  • 知识有截止日期:训练数据非实时更新
  • 无法自主判断价值:需要人工审核把关
  • 缺乏情感和创造力:深度创作仍受限
数据来源:Business Research Insights AIGC市场报告

Token:AI世界的"最小信息积木"

核心类比:Token就像乐高积木——大模型处理信息时,把文字拆成一块块"积木",每块就是一个Token。1个汉字约等于1-2个Token。

Token拆解示例
原句:"人工智能正在改变世界"
Token拆分:
• 人工智能 → 1个Token
• 正在 → 1个Token
• 改变 → 1个Token
• 世界 → 1个Token
总计:4个Token(约4个汉字)
Token计费逻辑
计费公式:总费用 = (输入Token + 输出Token) × 单价
• 输入100字 ≈ 130 Token
• 输出200字 ≈ 70 Token
• GPT-3.5级别:约$0.0004
关键认知:Token数量直接影响API调用成本
数据来源:虎嗅《Token经济学》

Agent与算力:AI的"手脚"与"大脑燃料"

Agent:AI的"手脚"
能自主执行任务的"机器人助理"
Agent不仅能回答问题,还能:
• 调用工具、搜索网页、操作软件
• 根据目标自主规划执行步骤
• 连接大模型与外部世界的桥梁
典型实例:
• AutoGPT:自动分解任务并执行
• 阿里通义千问:Agent模式调用插件
• 百度文心:多工具协同完成任务
算力:AI的"大脑燃料"
没有GPU,大模型就像没有电的电脑
GPU是AI训练和推理的核心硬件:
• 算力成本占AI公司总成本60%+
• 阿里云、华为云布局智算中心
• 国产芯片:华为昇腾、寒武纪
关键数据:
• OpenAI 2025年算力成本160亿美元
• DeepSeek-V3训练仅557万美元
• 推理成本正超过训练成本
Agent让大模型从"能说话"变成"能做事",算力则是这一切的底层支撑。没有算力,Agent就是无源之水;没有Agent,算力就是无的放矢。
GPU是AI训练和推理的核心硬件: • 算力成本占AI公司总成本60%+ • 阿里云、华为云布局智算中心 • 国产芯片:华为昇腾、寒武纪 关键数据: • OpenAI 2025年算力成本160亿美元 • DeepSeek-V3训练仅557万美元 • 推理成本正超过训练成本
数据来源:虎嗅《AI基础设施观察》

AIGC技术架构:三层金字塔模型

AIGC产业形成三层金字塔架构,从基础设施到用户产品,中国企业均有代表性布局。

应用层:面向用户的具体产品
ChatGPT、豆包、文心一言等对话产品
Midjourney、可灵AI等图像视频工具
Suno、Udio等音乐生成应用
中间层:垂直工具与平台
可灵AI:全球用户2200万,视频生成份额超30%
Midjourney:AI图像生成标杆产品
Suno:文本生成音乐,降低创作门槛
基础层:大模型训练与算力基础设施
百度文心:中文理解能力领先,日均调用量超10亿
阿里通义:开源模型Qwen系列全球下载量第一
DeepSeek:开源策略,模型能力接近GPT-4
数据来源:东方财富AIGC产业研究报告

中国AI发展时间线:从跟跑到并跑

中国AI大模型仅用两年时间,完成从跟跑到并跑、再到部分领跑的跨越式发展。

2022
2022.11
2023
2023.03
2024
2024.05
2025
2025年
2026
2026年
关键洞察:两年间,中国AI大模型从跟跑到并跑,再到部分领域领跑。2025年日均Token调用量突破100万亿,2026年国产模型周处理Token量达12.96万亿,超越美国的3.03万亿。
数据来源:虎嗅、新浪财经
CHAPTER 02

02 国内大模型生态格局

2026年最新版"百模大战"全景图。拆解中国大模型市场的竞争格局,从一线巨头到独立新锐,从模型能力到商业模式,帮助从业者理解技术供给端的现状。

"百模大战"后的格局分化:三大阵营

中国大模型市场分化为三大阵营,各阵营基于不同资源禀赋形成差异化竞争策略。

一线巨头
全能全域,全栈AI能力
• 字节豆包:全能型对话AI,网感任务突出
• 阿里通义:Qwen3-Omni登顶全球开源榜
• 百度文心:中文理解领先,降价40%
• 腾讯混元:依托微信生态差异化
核心特征
覆盖C端和B端,全栈布局
顶尖独立
技术专精,单点突破
• Kimi:长文本处理能力行业领先
• DeepSeek:开源+低成本颠覆市场
• 智谱AI:学术评测技术实力强劲
核心特征
聚焦技术深度,单点突破
垂类龙头
行业深耕,场景落地
• 讯飞星火:教育、医疗垂直深耕
• 华为盘古:政企行业解决方案
• 垂类优势:行业知识+场景深度
核心特征
聚焦特定行业,建立壁垒
三大阵营并非泾渭分明,巨头也在布局垂类,独立厂商寻求生态合作,竞争格局仍在快速演变。
• 字节豆包:全能型对话AI,网感任务突出 • 阿里通义:Qwen3-Omni登顶全球开源榜 • 百度文心:中文理解领先,降价40% • 腾讯混元:依托微信生态差异化 核心特征 覆盖C端和B端,全栈布局
数据来源:新浪新闻

头部厂商动态:Kimi、豆包、元宝三足鼎立

厂商评测结果
Kimi:1124分综合排名第一,长文本处理能力领先
豆包:1096分,网感类任务和娱乐场景表现突出
元宝:1074分,依托微信生态实现差异化竞争
阿里通义:Qwen3-Omni登顶全球开源模型榜单
百度文心:4.5宣布降价40%,加速市场渗透
智谱AI:在学术评测中保持技术领先
三足鼎立洞察
2026年5月最新评测显示,Kimi、豆包、元宝三足鼎立格局初现。各厂商差异化竞争策略明显:Kimi长于长文本,豆包强于网感,元宝依托微信生态。
chart
数据来源:PHP中文网、Toolifies

DeepSeek现象:开源策略如何颠覆市场

核心特点
  • DeepSeek-V2发布于2024年5月,引发国内大模型价格战
  • 模型能力接近GPT-4,成本仅为其1/10
  • 开源策略让全球开发者免费使用顶尖模型
  • DeepSeek-R1推理模型在数学、编程任务表现优异
  • 成为全球开发者下载量第三的AI应用
  • 迫使闭源厂商调整定价策略,开源模式重塑全球AI竞争格局
关键洞察
DeepSeek以开源+低成本策略颠覆市场,训练成本仅为GPT-4的1/10,成为全球开发者下载量第三的AI应用。开源模式正在重塑全球AI竞争格局。
全球竞争力
DeepSeek证明了中国AI不仅在应用层创新,在基础模型层面同样具备全球竞争力。开源策略正在打破美国的技术垄断预期。
chart
数据来源:虎嗅、今日头条

2026年大模型价格战:免费额度持续扩大

国内大模型价格持续下探,与国际厂商对比,国产模型在价格上竞争力显著。

价格战三大趋势
趋势一:免费额度持续扩大。豆包Lite、Qwen3-Turbo完全免费,文心4.5每月赠送100万Token
趋势二:国产价格仅为国际1/10。GPT-4o输入$5/百万Token,国产模型普遍低于$0.5
趋势三:盈利模式仍待探索。OpenAI每赚1美元净亏0.6美元,国内厂商同样面临盈利压力
数据来源:freeaitool.com LLM价格对比

大模型厂商的商业模式:订阅、API、生态

三大商业模式并行发展,但盈利压力持续存在,行业仍在探索可持续的盈利路径。

C端订阅制
直接向用户收取订阅费
• ChatGPT Plus:20美元/月
• 文心一言会员:国内C端付费
• 豆包会员:娱乐场景增值
核心逻辑
通过高级功能吸引用户付费,
形成稳定的现金流收入
B端API
按Token计费,开发者调用
• 火山引擎:字节云服务平台
• 阿里云百炼:企业级API
• 按Token计费:用多少付多少
核心逻辑
面向开发者和企业,
提供稳定可扩展的API服务
生态整合
AI嵌入现有产品生态
• 腾讯元宝:打通微信生态
• 阿里千问:融入淘宝、钉钉
• 华为盘古:政企行业方案
核心逻辑
通过现有产品流量变现,
降低用户获取成本
盈利困境:高收入与高成本并存
OpenAI 2025年年化收入200亿美元,算力成本160亿美元,每赚1美元净亏0.6美元。国内厂商同样面临盈利压力。
• ChatGPT Plus:20美元/月 • 文心一言会员:国内C端付费 • 豆包会员:娱乐场景增值 核心逻辑 通过高级功能吸引用户付费, 形成稳定的现金流收入
数据来源:虎嗅
CHAPTER 03

03 Token经济:商业模式与成本逻辑

从"算力消耗"到"Token结算"的价值重构。深入拆解Token经济的底层逻辑——为什么Token成为AI时代的"价值锚点"?它的成本如何计算?带来了哪些新商业模式?

Token计费逻辑:一次对话花多少钱?

核心公式:总费用 = (输入Token + 输出Token) × 单价。对话成本取决于输入长度 × 模型单价。

计费公式
总费用 = (输入Token + 输出Token) × 单价
输入越长、模型越先进,单次调用成本越高。选择匹配业务需求的模型是成本控制的关键。
计费示例
• 用户输入100字 ≈ 130 Token
• 模型返回200字 ≈ 70 Token
• 使用GPT-3.5级别模型
≈ $0.0004 / 次
1个汉字 ≈ 1-2个Token
数据来源:CSDN博客《大模型Token计费详解》

2026年国内外模型API价格全景对比

国产模型价格优势显著,部分完全免费,国际模型价格仍高出数倍至数十倍

API价格对比
豆包Lite / Qwen3
完全免费
国产头部
$0.3~1.0 / 百万Token
GPT-4
$30 / 百万Token
数据来源:freeaitool.com, cnblogs.com

Token成本拆解:从电力到GPU到输出

Token成本全链路
电力成本
数据中心电费
数据中心
运维与散热
GPU芯片
采购与租赁
训练/推理
模型计算
Token输出
最终用户成本
OpenAI 2025年成本结构
算力租卡成本:160亿美元
年化收入:200亿美元
经营性亏损:119.2亿美元
每赚1美元净亏:$0.6
关键趋势
推理成本正在超过训练成本,成为新的成本中心。
随着模型调用量爆发式增长,推理阶段的GPU消耗持续攀升。
API定价的核心压力来自推理,而非训练。
结论:Token成本 = 电力 + 数据中心 + GPU + 训练/推理。理解成本结构有助于在采购AI服务时做出更明智的决策。
推理成本正在超过训练成本,成为新的成本中心。 随着模型调用量爆发式增长,推理阶段的GPU消耗持续攀升。 API定价的核心压力来自推理,而非训练。
数据来源:虎嗅《OpenAI的200亿美元与160亿美元》

Token经济新商业模式:从订阅到按量

案例一
迅策科技:从订阅到按Token
从订阅制转为"单次价格×Token次数×模块数"模式
2025年收入12.85亿元,同比增长103%
Token付费收入占比目标20-30%
案例二
无问芯穹:Token调用量爆发
平台日均Token调用量较2025年底增长超20倍
以MaaS模型即服务为核心商业模式
按量计费降低企业AI使用门槛
订阅制 vs 按Token计费
传统订阅制
固定月费/年费,无论使用多少
资源可能浪费,成本不可控
按Token计费 用多少付多少,与产出直接挂钩 成本可量化,ROI更清晰
对传媒行业的启示:Token经济让内容生产的AI成本与产出直接挂钩。一篇10万字的AI辅助审校与一篇1000字的摘要生成,成本差异清晰可见,ROI更可量化。
平台日均Token调用量较2025年底增长超20倍 以MaaS模型即服务为核心商业模式 按量计费降低企业AI使用门槛
数据来源:36氪《迅策科技转型》,虎嗅《无问芯穹》

Token出海:中国AI的"新出口商品"

Token出海的本质
海外开发者调用中国模型的API,等于购买中国的算力服务。Token是"智能时代的价值锚点"和"结算单位"。
— 国家数据局局长 刘烈宏
数据亮点
中国模型周处理 12.96万亿 Token,是美国的 4.3倍。Token出海正在拉动算力网络、数据中心和边缘计算建设,形成新的价值链。
chart
数据来源:新浪财经《Token经济新出口》,虎嗅
CHAPTER 04

04 AI浪潮下传媒行业变革

从内容生产到传播分发的全链路重塑。本章聚焦AI对传媒行业的实际影响——哪些场景已经落地?哪些案例值得借鉴?哪些方向被证明可行/不可行?

传媒行业AI落地的六大高频场景

辅助编辑
  • 事实核查与验证
  • 语音转文字
  • 自动配字幕
  • 智能剪辑辅助
  • 新华社调查:探索最多
创作内容
  • 生成文章摘要
  • 制作数据图表
  • 数字主播配音
  • 辅助内容生成
  • 提升生产效率
策划选题
  • 草拟采访提纲
  • 热点趋势分析
  • 选题智能推荐
  • 受众兴趣预测
  • 数据驱动决策
智能审校
  • 错别字与语法纠错
  • 政治术语审核
  • 事实性错误检测
  • 统一体例规范
  • 出版行业刚需
多模态创作
  • 图文转视频
  • AI动画生成
  • 多平台内容适配
  • 融媒体内容工厂
  • 一键多形态输出
个性化分发
  • 算法推荐引擎
  • 用户画像构建
  • 精准内容触达
  • 提升阅读转化率
  • 千人千面推送
数据来源:新华社《AI编辑部调研》

案例拆解:新华社"AI编辑部"

新华社"AI编辑部"系统
核心能力:文字稿自动转化为短视频、音频、H5等形态,适配不同平台。
新华智云:发布25款媒体机器人,助力新闻采集和处理。
媒体大脑·MAGIC:最快一条世界杯短视频从进球到发布仅需6秒。
智能采访终端:一部手机完成融媒体稿件处理。
6秒
世界杯短视频生成
25款
媒体机器人
多形态
视频/音频/H5自动转换
关键启示
新华社"AI编辑部"的核心价值在于重构新闻生产流程,而非简单替代记者。
AI负责"快"——快速采集、快速转换、快速分发;记者负责"深"——深度调查、深度解读、深度判断。
这种模式对传媒行业具有高度可复制性。
核心能力:文字稿自动转化为短视频、音频、H5等形态,适配不同平台。 新华智云:发布25款媒体机器人,助力新闻采集和处理。 媒体大脑·MAGIC:最快一条世界杯短视频从进球到发布仅需6秒。 智能采访终端:一部手机完成融媒体稿件处理。
数据来源:华东师范大学《AI编辑部研究》

案例拆解:人民日报、央视的智能化转型

人民日报"创作大脑AI+"
集纳近20款智能工具
一站式完成采访、拍摄、直播、剪辑、发布
"智晓助"系统:
机器辅助识别文稿、图片、视频中的不规范内容
实现全流程智能化覆盖
央视AI云剪辑平台
12路直播信号智能加工
90秒生产一条短视频
"总台算法"内容漏斗模型
央视频10多个板块应用后
播放指标增长50-300%
转型核心逻辑
人民日报和央视的转型路径呈现共同特征:平台化整合 + 工具化赋能 + 数据化驱动。
不追求"无人化",而是打造"人机协同"的智能化工作流——AI处理重复性、标准化任务,人类聚焦创意、判断和深度。
对县级融媒体中心而言,这种"平台+工具"模式尤其具有参考价值。
数据来源:人民网研究院,央视频官方数据

案例拆解:杭州电视台AI数字人主播

杭州电视台:国内首个常态化AI数字人播报
2024年春节,《杭州新闻联播》启用6位AI数字人主播。
接入DeepSeek-V3大模型,具备实时文稿审核与新闻整合能力。
播报准确率显著提升,成为国内首个常态化应用数字人播报的新闻机构。
数字人主播矩阵可7×24小时工作,大幅降低人力成本。
6位AI数字人主播
AI数字人主播
7×24h
全天候工作能力
DeepSeek
V3大模型驱动
关键启示
数字人主播不是替代真人主播,而是拓展播报场景——夜间新闻、突发事件、多语种播报等。
DeepSeek-V3的接入使数字人具备"思考"能力,从"读稿机器"升级为"智能主播"。
对地方电视台而言,这是降本增效的切实路径。
数据来源:人民网研究院《AI数字人应用》

可灵AI:AIGC如何重构影视制作流程

可灵AI平台能力
从剧本预演、镜头生成到后期制作全链条自动化
全球用户规模突破2200万
访问量份额超30%
动态渲染、语义匹配、风格建构三大技术支柱
赋能小团队以工业级内容输出能力
2200万+
全球用户规模
30%
访问量份额
49%
AI视频采用率增长
2025年流媒体公司和数字广告商中,AI视频创作采用率增加49%
AIGC重构影视制作流程
剧本预演
AI生成视觉预览
镜头生成 AIGC视频生成
后期制作 自动剪辑与合成
成品输出 工业级内容
核心价值:可灵AI让小团队拥有工业级内容输出能力,大幅降低影视制作门槛。这对融媒体中心、MCN机构、地方电视台具有直接参考价值。
核心价值:可灵AI让小团队拥有工业级内容输出能力,大幅降低影视制作门槛。这对融媒体中心、MCN机构、地方电视台具有直接参考价值。
数据来源:人民网研究院《AIGC影视应用》

出版业AI应用:智能审校与选题策划

蜜度"文修"智能校对
智能校对大模型实现90秒校对20万字,覆盖字词、标点、语法、政治术语等多维度纠错。
90秒 / 20万字
多维度智能审校
果麦文化"AI校对王"
引入超百亿字训练数据,已被超过20家出版单位采用,覆盖图书全品类校对场景。
20+ 家出版单位使用
超百亿字训练数据
人教社AIGC实验室
建立AIGC实验室,完成ChatGPT、通义千问、文心一言等主流大模型在出版场景的验证测试。
多模型 验证测试
主流大模型全覆盖
数传集团AI编辑工作室
AI编辑工作室使选题策划提效57-89%,实现从热点追踪到选题报告生成的智能化闭环。
57-89% 选题策划提效
智能化闭环
数据来源:搜狐《出版业AI应用观察》

成功转型的可复制要素:技术+流程+人才

技术层面
选择与业务匹配的AI工具
不盲目追求大模型参数
评估ROI与成熟度
流程层面
重构工作流而非简单叠加
打通数据孤岛
芜湖"智能媒体大脑"案例
人才层面
培养"AI+传媒"复合型人才
建立内部AI培训体系
技术+内容双轮驱动
核心洞察:技术、流程、人才三者缺一不可。技术是手段,流程是载体,人才是核心。任何单一要素的突出都无法支撑成功转型。
核心洞察:技术、流程、人才三者缺一不可。技术是手段,流程是载体,人才是核心。任何单一要素的突出都无法支撑成功转型。
数据来源:响声网、澎湃新闻

被证明不可行的方向:这些坑别踩

传媒AI转型中已被实践验证的四大误区
"无人编辑部"幻想
AI在深度解读、情感表达、价值判断上仍有根本局限,完全替代人类编辑的设想已被证伪。
未经审核直接发布
BuzzFeed等曾因AI内容质量下降导致用户流失,内容未经人工审核直接发布是危险做法。
盲目采购昂贵硬件
不配套流程改造的硬件采购沦为"高科技摆设",技术投资必须与业务场景深度匹配。
忽视版权法律风险
AI内容生产面临版权归属不清、法律合规等挑战,忽视风险可能导致严重法律后果。
数据来源:辽宁日报新媒体

有潜力的方向:2026-2027值得关注的赛道

未来1-2年传媒AI领域最值得布局的五个方向
人机协同深度报道
AI处理海量数据,记者专注深度访谈与叙事,实现"数据+故事"的融合报道。
个性化内容生成
基于用户画像的"千人千面"新闻推送,从"人找内容"转向"内容找人"。
多模态内容工厂
一条新闻稿自动生成图文、视频、音频、H5,实现"一次生产、多端分发"。
AI知识服务
从"卖书"到"卖智能知识包",出版边界从纸质书扩展到交互式服务。
方言与国际化传播
AI翻译+本地文化适配,助力中国内容走向全球,实现跨语言传播。
数据来源:响声网

Token经济对电信行业的影响:新商业模式

算力网络需求爆发
Token调用量两年增长超千倍,拉动数据中心和边缘计算基础设施建设进入高速增长期。
新商业模式
运营商从"卖带宽"转向"卖算力+卖Token",航锦科技等布局Token出海基础设施。
产业链重构
上游芯片、中游数据中心、下游应用形成Token价值链,但需关注数据安全和终端议价能力风险。
关键洞察
1. 算力成为核心资产
2. 计费模式从带宽转向Token
3. 产业链上下游深度耦合
chart
数据来源:新浪财经、同花顺
CHAPTER 05

05 出版行业的AI应用实践

从图书编辑到知识服务的全链路升级。聚焦出版行业的具体AI应用——智能审校、内容生产、知识服务、融媒体制作,为出版从业者提供可直接参考的落地路径。

图书编辑工作流:AI如何重塑"编、审、校、发"

+30%
选题命中率提升
-50%
校对时间缩短
400
张AI生成插图
全链路
AI营销覆盖
典型案例:中国科传通过AI分析读者行为数据,选题命中率显著提升;福建少儿社《森林画报》400张图片全部AI生成;AI自动生成书评和短视频脚本,实现全网精准推送。
数据来源:搜狐、汉斯出版社

智能审校:从"人工三审三校"到"AI+人工"协同

AI不替代人工,而是将人解放到更高价值环节
AI负责:字词、标点、语法、政治术语、领导人职务、机构名称等多维度自动纠错
人工负责:价值判断、深度解读、情感表达、创意策划
chart
数据来源:搜狐科技

期刊出版的AI应用:从AI检测到学术不端防范

智能审稿系统应用NLP技术,自动校验参考文献、检测学术不端,单篇稿件处理用时缩短40%。

96% — AI检测准确率
智能审稿系统可自动校验参考文献、检测学术不端,大幅提升审稿效率。
中华医学会杂志社
应用AI审稿系统,单篇稿件处理用时缩短40%。
中国科传"科学文库"
AI辅助知识检索与学术内容生成。
高教社H0大模型
赋能智能备课、出题组卷、个性化学习,将大模型能力深度融入教育出版全流程。
chart
AI检测 vs 人工复核占比
数据来源:搜狐、汉斯出版社

知识服务新形态:从"卖书"到"卖智能知识包"

AI推动出版业从"内容搬运工"向"知识价值创造者"转型
交互式数字人
中图云创"马可·波罗数字人"可与观众实时对话,打造沉浸式知识体验。
AI学习助手
童趣与数传合作为迪士尼图书配备AI学习助手,实现个性化阅读辅导。
有声书多媒体
TTS技术实现一键转语音,多角色配音,让书籍"开口说话"。
知识图谱
关联图书内容与外部知识,构建深度阅读网络,提供系统性知识体验。
核心趋势:出版的边界正在从纸质书扩展到智能服务。未来的出版机构不是"卖书"的,而是"卖知识解决方案"的。
核心趋势:出版的边界正在从纸质书扩展到智能服务。未来的出版机构不是"卖书"的,而是"卖知识解决方案"的。
数据来源:搜狐《出版业AI应用观察》

融媒体内容制作:AI实现高效率、轻量化、多元化

县级融媒体正通过AI实现"小团队、大产出",覆盖全媒体平台。

芜湖传媒中心
打造"智能媒体大脑",AI赋能全链路内容生产,实现从媒体运行到城市运营的转变。
广西来宾市融媒体
构建10名AI数字人主播矩阵,探索方言播报、虚拟记者等创新应用。
三原县融媒体中心
锦华科技签约覆盖报纸、网站、微信、微博、头条等全平台内容审校。
核心启示
  • 小团队产出大内容
  • 一人多岗变为AI+人协同
  • 覆盖全媒体平台
  • 方言与本地化创新
chart
AI赋能融媒体内容生产流程
数据来源:锦华科技、响声网

AI带来的四大新型学术风险

风险特征:AI生成内容隐蔽性高,查重系统难以识别 典型案例: • 中国地质大学论文残留Certainly提示词 • 韩国The AI Scientist工具隐蔽式复用 • 华南师范大学跨语言英译中剽窃

学术剽窃风险
风险特征:AI生成内容隐蔽性高,查重系统难以识别
典型案例:
• 2023年《Physica Scripta》撤稿首例AI论文:文中残留"Regenerate response"(Nature报道)
• 中国地质大学论文残留"Certainly"等ChatGPT回复痕迹
• 华南师范大学:跨语言英译中剽窃,AI翻译外文论文后当原创发表
• 韩国学者使用The AI Scientist工具隐蔽式复用他人代码与思路
数据造假风险
风险特征:AI可伪造数据、图像、参考文献
典型案例:
• 香港大学24篇虚假参考文献,占引用40%
• 西安红会医院SCI论文使用AI插图
• 中科院《Ecological Indicators》撤稿12篇
• MIT博士伪造数据,AI使新材料提升44%
隐私泄露风险
风险特征:未脱敏数据上传第三方AI平台
典型案例:
• 航天领域轨道参数等数据上传后外泄
• 敏感信息输入大模型(国家安全部披露)
• OpenClaw 10.8%插件含恶意代码
伦理失范风险
风险特征:AI代写突破学术主体边界
典型案例:
• 维尔纽斯大学、明尼苏达大学AI代写开除
• 律师引用AI编造不存在的法律案例
• ICLR/CVPR论文AI生成核心创意
• 社会科学研究放大刻板印象
风险特征:AI代写突破学术主体边界 典型案例: • 维尔纽斯大学、明尼苏达大学AI代写开除 • 律师引用AI编造不存在的法律案例 • ICLR/CVPR论文AI生成核心创意 • 社会科学研究放大刻板印象

主动违规 vs 无意识违规:典型案例警示

主动违规
AI代写论文
• 立陶宛维尔纽斯大学约10名学生被开除
• 耶鲁EMBA学生判不及格停课
• 明尼苏达大学博士三年级中国留学生被开除
伪造文献
• 香港大学AI批量伪造参考文献(2025),论文撤稿、导师辞职
• 斯坦福大学AI伪造高引文献虚构被引次数
• AI生成虚假临床数据集(眼科手术疗效)
恶意规避审查
• 用AI句式改写、同义词替换、段落重组逃避查重
• 去AI化反向操作:先用AI生成再用Quillbot去AI化
无意识违规
论文残留AI提示词
• 全球首例AI提示词撤稿,出现Regenerate response等ChatGPT原文
语言润色越界
• Grammarly Premium重写句子功能导致整篇论文句式、逻辑被AI重构
• 教育部抽检论文语言过于完美且逻辑高度程式化被质疑
用AI描述实验结果
• 自己做实验让AI写Discussion,学术思想、结论解读让机器完成
数据来源:搜狐传媒、各大学公开通报

不同学科的AI不当使用:这些"雷区"你踩过吗?

人文社科
田野调查/口述史造假
社会学学生用AI扩写访谈记录,基于大数据刻板印象而非真实观察
医学领域
图像与数据双重失范
《Medicine》期刊论文AI生成骨骼图,小腿和手臂骨骼数量与解剖学不符,标签含随机字符串
工科方向
伪造算法和实验数据
AI生成虚假实验数据、统计结果、仿真图表,无真实实验;AI直接生成模型结构导致不同院校论文高度雷同
经管学科
政策建议的空中楼阁
AI生成立即取消所有户籍限制等建议,无视社保体系、财政分担机制等现实约束,纸上谈兵

学术出版的红线与底线:四个"严禁"

严禁AI代写论文
禁止用AI伪造论文数据、案例、参考文献及实验结果;拒绝AI拼凑整合,保证原创性;不得让AI替代核心研究环节,仅可用于辅助性操作
严禁数据伪造篡改
禁止AI生成虚假实验数据、调研数据及统计结果;不得用AI篡改原始数据、调整数值、歪曲结论;所有数据需真实可查、来源合规,留存原始记录
严禁未标注AI使用
只要使用AI辅助,无论场景轻重,均需如实标注;标注需明确AI工具名称、使用环节及具体用途;严禁隐瞒,未标注属于学术不端
严禁使用违规AI工具
禁用可伪造、篡改数据的违规AI工具;禁用含伪造文献、虚假引用功能的AI模块;仅选用合规、可追溯的AI工具
禁止用AI伪造论文数据、案例、参考文献及实验结果;拒绝AI拼凑整合,保证原创性;不得让AI替代核心研究环节,仅可用于辅助性操作

可落地的学术道德风险防控方法

个人层面
坚守学术诚信,杜绝AI代写、伪造数据、伪造文献
主动学习学校AI学术使用规范,提升辨识能力
落实披露义务,如实披露AI使用细节(工具名称、使用场景),主动接受监督
学校/出版机构层面
制定明确AI使用规范,划定可使用场景和禁止行为,细化违规处罚
搭建分层分类培训体系,针对学生、科研人员、编辑开展AI学术规范培训
建立"自查+审核+抽查"全流程核查机制,配套AI内容检测工具
研究生培养/导师层面
强化前置引导,明确AI使用边界,将AI规范融入培养全过程
全程跟踪指导,重点核查AI辅助生成的内容(数据、文献、论证)
履行监管责任,结合典型案例开展常态化风险警示教育

AI学术规范小贴士:三个实用工作法

用"分步追问"取代"一键生成"——利用"思维链(Chain of Thought)"提示词,强制AI将写作任务拆解为"观点列举→逻辑推演→证据匹配"三个独立步骤。AI从"代笔者"转变为"逻辑陪练",最终语言组织与逻辑串联必须由人类完成。

01
思维链拆解法
出版人行动要点:审稿时关注论文是否有"AI痕迹"——逻辑过于流畅、论证过于程式化。
02
"三明治"工作流
强制遵循"人类构思框架→AI填充/润色→人类逐字核验"的操作流程,严禁"一键生成"。确立"人类对最终成果负全责"的底线。
出版人行动要点:建立AI内容检测环节,将AI检测纳入出版流程管控。
03
"透明化"声明术
在论文方法章节、课件首页或项目报告中,主动添加标准化的"AI使用披露声明"。符合国际主流期刊(Nature、IEEE)最新政策。
CHAPTER 06

06 从业者的机遇与挑战

传媒人如何在AI时代保持不可替代性。面向一线从业者,回答最关心的三个问题:哪些技能更值钱?如何提高工作效率?如何甄别AI信息?

传媒人应重点关注的五个方向

AI工具驾驭能力
熟练使用至少3-5款AI工具,成为"AI指挥家"而非"AI替代者"。掌握提示词工程,将AI作为效率放大器,在内容生产的各环节灵活调用,实现人机协作的最佳状态。
垂直领域专业深度
在财经、医疗、法律等特定领域建立AI无法替代的专业深度。垂直领域的知识壁垒和判断经验,是传媒人的核心护城河,也是与AI共生时代的关键竞争力。
内容价值判断力
AI可以生成海量信息,但无法判断什么信息值得传播。培养对新闻价值、社会意义和受众需求的敏锐判断力,决定内容传播的方向与深度,这是人的独特优势。
跨媒介叙事能力
从文字到视频到互动体验的多模态表达。掌握跨媒介叙事技巧,让同一内容在不同平台呈现最佳形态,提升内容传播效能,构建全媒介内容生产能力。
人机协同管理能力
设计AI辅助工作流程、审核AI输出质量。管理人机协同团队,确保AI生成内容符合专业标准和价值观,发挥人的把关作用,建立可靠的内容生产体系。
在财经、医疗、法律等特定领域建立AI无法替代的专业深度。垂直领域的知识壁垒和判断经验,是传媒人的核心护城河,也是与AI共生时代的关键竞争力。
资料来源:中国新闻出版广电报(xiangshengnet.com)

核心技能储备:哪些能力让AI无法替代你?

情感共鸣与价值判断
AI可以分析数据,但无法生成真正的"思想"和"温度"。人类独有的情感连接和价值判断是内容传播的灵魂。
现场采访与深度调研
AI无法替代新闻现场的"脚力、眼力、脑力、笔力"。深度报道需要亲身走访和人际信任,这是机器无法复制的。
创意策划与叙事创新
如人民日报《提笔》《起宏图》等AI创意产品,核心创意仍来自人类。AI是工具,创意才是内容的灵魂。
伦理把关与风险判断
AI内容审核、虚假信息甄别需要人类的伦理判断和责任意识。技术不能替代价值观,把关责任在人。
跨领域整合思维
连接技术、内容、商业、用户的复合能力。AI擅长单一任务,人类擅长跨领域整合,这是不可替代的优势。
核心观点
AI可以生成文字、图像、视频,
但它无法生成思想。
——人民日报新媒体中心主任 薛原
资料来源:澎湃新闻

如何甄别AI信息:避免被"幻觉"误导

关键信息必须通过原始出处确认,不轻信二手传播。养成追溯信源的习惯,确保信息真实可靠。

1
溯源验证
2
多源交叉
同一事件至少查看3个不同来源,对比报道差异。交叉验证是识别偏见和误报的最有效方法。
3
常识判断
违背常识的"惊人数据"要警惕。用逻辑和专业知识检验AI输出的合理性,不盲信权威。
4
工具辅助
使用AI检测工具识别AI生成内容。中华医学会杂志社率先引入AI检测,准确率达96%。
5
保持怀疑
AI越强大,对人的要求越高。保持批判性思维,对任何信息都多问一个"为什么",这是信息时代的生存技能。
案例:AI检测系统实战应用
中华医学会杂志社
中华医学会杂志社率先引入AI检测工具,辨别投稿是否由AI产生,准确率达96%。该系统为学术出版领域防范AI滥用提供了可复制的技术路径,有效维护了学术诚信。
96%
AI内容检测准确率
中华医学会杂志社 | 2025年实测数据
资料来源:辽宁日报

提升工作效率:AI可以帮传媒人做什么?

用AI生成初稿、扩展素材、优化标题,内容生产效率可提升30-50%。将AI作为创作助手,释放创意生产力。

内容生产与多模态转换
用AI生成初稿、扩展素材、优化标题,内容生产效率可提升30-50%。一条文字稿自动生成短视频脚本、配音、字幕,实现内容的多模态转换和跨平台分发,大幅提升传播效率。
数据分析与日常办公
AI辅助分析用户行为数据、热点趋势,帮助编辑和记者快速洞察受众需求,精准把握内容方向。会议纪要自动整理、邮件自动撰写、PPT大纲生成,将日常办公事务交给AI,专注核心内容创作。
学习提升
用AI快速理解新领域知识、跟踪行业动态,建立个人知识管理系统,在快速变化的时代保持竞争力。
chart
AI在传媒工作各环节的应用效能
资料来源:新华社

未来传媒人才画像:"AI+人文"复合型人才

技术理解力 + 专业深度
理解AI的能力和边界,不盲目崇拜也不恐惧。技术理解力是复合型人才的基础素养。在某个垂直领域有不可替代的专业深度,知识壁垒和判断经验是核心竞争力,也是与AI共生时代的关键护城河。
创新能力 + 伦理素养
能提出AI无法自主产生的创意问题,将技术工具与人文洞察结合,创造独特的内容价值。在AI应用中把握价值导向和合规边界,具备责任意识和文化敏感度,伦理素养是不可逾越的职业底线。
终身学习
AI每3-6个月迭代一次,保持终身学习能力,快速适应新技术和新场景,是传媒人最大的竞争力。
chart
未来传媒人才核心能力模型
资料来源:澎湃新闻

一本图书的"AI七十二变":从Word文档到出版物的全链路

以20万字计算机类图书为例,对比传统流程与AI辅助流程的效率差异

传统 vs AI辅助出版流程
传统流程:选题策划2-3周 → 内容编辑4-6周 → 三审三校3-4周 → 排版设计2-3周 → 营销发行1-2周,总计3-4个月

AI辅助流程:AI热点分析3天 → AI辅助写作2周 → AI校对90秒/20万字 → AI排版一键生成1周 → AI营销自动分发,总计72小时
关键数据亮点
90秒:AI校对20万字,传统需2-3周
30%:AI选题命中率比传统提升幅度
50%:排版时间缩短,AI一键生成
行业洞察
"AI不是让编辑失业,而是让编辑从'找错别字'的体力活中解放出来,把精力投入到真正创造价值的选题策划和内容打磨中。"
—— 果麦文化编辑总监
AI出版流程效率对比
AI出版流程效率对比
资料来源:搜狐传媒、蜜度科技、中国科传等公开案例整理

拥抱AI,但不迷失于AI

人工智能不是传媒行业的终结者,而是新质生产力的催化剂。技术的浪潮不可逆转,但内容的温度、思想的力量、人文的光辉,永远是传媒人的核心竞争力。
谢谢聆听 | 欢迎交流讨论
人工智能不是传媒行业的终结者,而是新质生产力的催化剂。技术的浪潮不可逆转,但内容的温度、思想的力量、人文的光辉,永远是传媒人的核心竞争力。
CHAPTER 07

07 AI案例专题:意图即代码

非技术者的AI协作共创与验证方法——从认知对齐到精准表达,再到迭代验证的完整工作流。

目录

01

开场与背景

02

引子:AI引起的变革

03

AI时代的基础概念

04

非技术者的优势

05

与AI的协作方法

CHAPTER 02

引子:AI引起的变革

案例一:AI参与破解80年数学猜想:从“检索答案”到“发现新路径”

2026年5月 OpenAI

OpenAI 内部模型提出了新的构造思路,帮助解决数学家 Paul Erdős 于 1946 年提出的“平面单位距离问题”相关猜想。重要之处不只是模型给出答案,而是它给出的推理路径获得了顶尖数学家的认真认可。

戏剧性转折:约 7 个月前,OpenAI 曾因“GPT-5 解决 10 个 Erdős 问题”的说法被数学界质疑:批评点在于模型更像检索到已有文献,而不是产生新的数学发现。

此前争议

“会找答案”不等于“会做数学”;学术界要求原创推理、可验证证明和专家审查。

这次认可

多位数学家认为模型给出了原创、巧妙且可推进的构造路径。

更准确的讲法:这不是“AI替代数学家”,而是 AI 第一次更有说服力地展示了从提出候选思路到接受专家检验的高水平协作潜力。

学术界评价

Tim Gowers(菲尔兹奖得主):

"如果这是人类写的论文提交给《数学年刊》,我会毫不犹豫地推荐接收。这是AI数学发展的里程碑。"

Noga Alon(普林斯顿大学):

"一个杰出的成就。AI在离散几何和代数数论之间架起了人类从未见过的桥梁。"

Arul Shankar

"当前AI模型不再只是助手——它们能够产生原创且巧妙的想法,并将其付诸实现直至成功。"

来源:OpenAI相关报道 · Scientific American · Live Science · WSJ, May 2026

案例二:AI视觉创作

传统海报设计流程

需求分析
创意构思
设计制作
修改迭代
几小时-几天 总周期

AI海报生成流程

描述需求
AI生成
调整优化
定稿输出
几分钟-几小时 总周期

流程展示:从人工海报到AI海报

初始人工海报

Step 1: 人工海报初稿

AI过渡阶段

Step 2: AI辅助过渡

AI生成海报

Step 3: AI海报最终版

AI海报生成:多方案不是终点,筛选标准才是关键

AI背景方案A

方案A:AI生成背景

AI背景方案B

方案B:AI生成背景

AI背景方案C

方案C:AI生成背景

「威尔·史密斯吃意大利面」:视频生成质量的快速演进

案例三:AI对劳动力市场的冲击

Anthropic · "Labor Market Impacts of AI" — Massenkoff & McCrory, 2026.3.5

高暴露 ≠ 立刻失业:真正变化发生在“任务重组”

Anthropic 用 Claude 使用数据构建“AI暴露度”指标,显示很多岗位的任务可被AI辅助或自动化,但企业部署、流程改造和责任边界仍限制落地速度

计算机与数学94% → 33%(61%差距)
办公与行政90% → 10%(80%差距)
商业与金融94% → 28%(66%差距)

已实际部署   理论可行但尚未部署

AI暴露最高的职业

程序员 75% 客服 70% 数据录入 67% 市场分析师 65% 金融分析师 57%

收入影响:高知高薪岗位首当其冲

最高暴露人群特征:薪资比平均高47%、研究生学历比平均多近4倍。AI冲击首先体现为任务结构变化:同一个岗位中,资料整理、初稿生成、重复沟通会被加速,而判断、沟通、责任承担仍需要人。

年龄结构:年轻人就业压力加剧

22-25岁高暴露岗位就业下降约16%。初级岗位招聘自2023年下降约35%。初级岗位的训练价值被重新定义:年轻人更需要尽快掌握“AI协作+领域判断”的复合能力。

未来趋势:AI的理论能力与实际部署之间存在巨大差距,这意味着岗位不会一夜消失,但“入门级、重复性、标准化”的白领任务会持续被压缩。随着部署加速,白领岗位将面临持续压力。

案例四:自然科学——AI正在进入“发现、建模、实验”流程

通用模型正在成为科研“通用接口”

大模型的价值不只在单项指标,而在于把文献、代码、数据、图像和实验流程接入同一个协作界面

GPT-4o(微调)82.67%
DenseNet121(传统CNN)81%
GPT-4o(零样本)73.67%
轻量级CNN基线61.67%

来源:Microsoft Azure AI Foundry, Oct 2025 · AI Multiple Benchmark, Sep 2025

AI科研全流程自动化

The AI Scientist(Sakana AI, 2024年8月):首个实现完整科研流程自动化的框架,从提出假设、编写代码、执行实验到撰写论文,每篇论文成本不到15美元

AgentLaboratory(AMD & 约翰·霍普金斯大学, 2025年2月):开源一站式科研AI智能体,覆盖文献检索、实验设计、代码生成到论文撰写全流程。

data-to-paper(NEJM AI, 2024年12月):从数据到可验证研究论文的全自动化平台,在简单研究目标中80-90%的案例能独立复现同行评审论文的发现。

AI正在从“工具”演变为可协助完成
"假设提出→实验执行→结果分析"
流程的数字科研协作者

案例五:社会科学——AI擅长处理材料,不自动理解社会

可用场景:把“资料密集型任务”变成可迭代流程

文献检索、访谈资料整理、开放式问卷编码、变量说明、初稿润色,都可以被AI显著加速。

但社会科学的核心不是“材料越多越好”,而是研究问题、理论框架、样本偏差、语境解释和伦理边界。AI可以帮你更快处理材料,不能替你承担解释责任。

检索
快速定位主题和争议
整理
访谈/问卷材料归类
写作
结构化初稿与修改建议

AI的优势与局限

AI擅长:

提炼材料 · 生成对照表 · 辅助开放式编码 · 翻译与润色 · 形成可讨论的初稿

AI短板:

样本代表性 · 价值判断 · 文化语境 · 研究伦理 · 把相关性误读为因果性

核心启示:社会科学案例最适合用来说明“AI协作不是外包思考”。真正决定研究质量的仍是问题意识、方法选择、理论解释和伦理自觉

来源:LLM social science research literature, PNAS / Nature Human Behaviour discussions

CHAPTER 03

AI时代的基础概念

AI核心概念关系脉络(上)—— 从理论到技术

包含层级 ▾
人工智能 AI
Artificial Intelligence
能为明确或隐含目标做预测、生成、推荐或决策的系统
机器学习 ML
Machine Learning
从数据中学习规律,而不是逐条手写规则
深度学习 DL
Deep Learning
多层级神经网络,自动提取特征
神经网络 NN
Neural Network
模拟神经元,层级连接处理模式识别
Transformer
2017 · "Attention Is All You Need"
自注意力机制——GPT/LLM的基石
模型技术层
大语言模型
LLM
基于大量文本和指令数据训练,擅长语言、代码和推理式生成
AIGC
AI Generated Content
AI生成文本、图像、音频、视频和代码等内容
模型生产过程
模型训练
Training
海量数据+算力 → 模型学习参数
模型蒸馏
Distillation
大模型知识 → 压缩到小模型
人与AI交互方式
Prompt
提示词工程
用上下文、目标、约束和验收标准引导AI输出
Vibe Coding
快速对话式原型,适合探索,不适合直接上线
Spec Coding
用规格、测试和验收标准驱动AI实现

AI核心概念关系脉络(下)—— 智能体与工程落地

通信协议标准
MCP 模型上下文协议
Model Context Protocol · Anthropic 2024
让AI系统以标准方式连接外部工具、数据源和工作流
通过MCP协议集成 ↓
智能体核心
智能体 Agent
AI Agent
模型 + 目标 + 记忆 + 规划 + 工具调用
Skill / 工具能力
Tool / Capability Module
可被Agent调用的能力单元
搜索/代码/文件/API/浏览器
工程实现模式 ↓
RAG / Workflow / Agent
检索增强 · 工作流编排 · 工具调用
把模型嵌入真实业务流程,而不是只停留在聊天框
工程落地层
AI应用
AI Application
面向最终用户的产品
本地部署
Local Deployment
私有化运行·数据安全
知识库
Knowledge Base
外部知识存储与RAG检索
小团队增强
Human + AI Workflow
个人或小团队获得更高执行密度

MCP协议 Agent/Skill 工作流编排 AI应用落地

从「聊天对话」到「工具调用」——AI应用的关键是可靠地接入真实流程

CHAPTER 04

非技术者的优势

技术门槛抹平:专业人士拿回话语权

AI产品的应用落地使技术门槛大幅降低,原本在各自领域的专业人士重新掌握了创作主导权。

🎬

AIGC电影创作

好的AIGC电影仍需要导演把控叙事节奏、视听类人才设计镜头语言——AI生成画面,但故事和情感由人定义。

🎨

AI艺术设计

高艺术性的AI海报仍需要设计师定义风格、调整细节、把控审美——AI是画笔,人是画家。

🎮

游戏开发

好的游戏仍需要深谙用户心理的游戏从业者设计玩法和体验——AI生成素材,人设计体验。

📖

文学创作

好的剧本仍需要文学创作者给出大框架、遴选和优化内容——AI生成文本,人赋予灵魂。

话语权的本质:谁能定义好问题,谁就能指挥AI

💻
【计算机/软件工程领域】

工程架构能力

程序员对复杂项目的工程架构与管理能力

🎬
【影视/创意领域】

视听引导能力

导演对AI片段生产的视听描述与抽卡遴选能力

🎨
【设计/艺术领域】

审美方向能力

设计师对风格、美感的方向引导能力

低质量、重复性、缺少判断的工作更容易被AI替代或压价,因为任何外行都可以依托AI完成原本有专业门槛的基础工作。

📚 语文老师说:"我需要一个学生点名的工具" → AI生成友好界面应用

📖 武侠爱好者将小说文本输入即梦 → AI生成对应片段视频

AI时代的核心能力:把模糊意图变成可执行、可验收的任务

定义问题 · 拆解任务 · 约束边界 · 验证结果

定义问题

目标:谁使用?解决什么问题?为什么现在要做?

场景:在什么环境、设备、流程中发生?

成功标准:什么结果才算可用,而不只是“好看”?

先定义问题,再请求答案

拆解任务

任务拆解:将复杂目标分解为AI可执行、可检查的子任务

流程编排:安排不同工具/模型在合适环节协作

检查清单:把需求转成验收标准,避免“看起来对,其实不可用”

从“提需求”升级为“拆任务”

约束边界

资源约束:时间、预算、素材、技术栈和设备环境

风险约束:隐私、版权、安全、合规和伦理边界

输出约束:格式、尺寸、性能、兼容性和交付标准

先定边界,再让AI发挥

验证结果

事实核查:要求来源、日期、假设和不确定性

用户路径:按真实场景测试,而不只看截图

风险边界:识别隐私、安全、版权和伦理问题

没有验证,生成越快风险越大

示例:用AI做一个“课堂点名与反馈”小工具

1. 定义问题:老师需要快速点名、记录缺勤,并收集课后1分钟反馈。
2. 拆解任务:先做学生名单导入,再做点名按钮,最后做反馈统计。
3. 约束边界:不上传真实身份证号;数据只保存在本地;手机端可用。
4. 验证结果:用10名虚拟学生走完整流程,故意漏填、重复点名、缩小屏幕测试。
CHAPTER 05

与AI协作构建应用

核心转变:从“让AI帮我做”变成“我管理一个AI协作流程”

低效:把AI当许愿机

• 一次说一个很大的愿望

• 只看第一版是否惊艳

• 不说明边界、数据和验收标准

• 出错后让AI“全部重做”

• 把生成结果直接当成最终结果

有效:把AI当协作团队

• 先写目标、用户、约束和验收标准

• 每次只推进一个可检查的任务

• 用截图、日志、测试结果反馈问题

• 保留可用版本,再继续迭代

• 重要场景请专业人员复核

🎬
你 = 导演
定义方向、把控质量、做出决策
+
🤖
AI = 执行团队
写代码、画UI、调布局、修bug
=
🚀
可运行应用
想法→产品,几小时完成

关于 Vibe Coding:它适合快速探索和原型验证;一旦涉及真实用户、数据、支付、隐私或安全,就必须转向规格、测试和人工复核。

方法一:Prompt四要素——让AI知道“要什么、像什么、不能怎样、如何验收”

📋
目标
做什么产品?给谁用?
🎨
风格
什么视觉风格?调性?
⚙️
约束
技术边界?不能用什么?
验收
怎样算成功?

❌ 模糊Prompt

"帮我做一个好看的页面"

AI产出结果 ⬇

随机生成的页面
风格不确定 · 内容空洞 · 需反复修改

✅ 四要素Prompt

"做一个极简风格的个人作品集网站。
目标:展示设计作品,吸引潜在客户。
风格:深蓝+白色,留白多,干净。
约束:纯HTML/CSS,单页,移动端适配。
验收:页面加载快,视觉专业。"

AI产出结果 ⬇

MY PORTFOLIO
专业 · 一致 · 一次生成接近成品

方法二:描述系统,而不只描述屏幕

页面只是结果,系统才是规则:数据从哪里来、用户如何流转、异常如何处理。

❌ 屏幕思维(只描述UI)

"创建一个登录页面,有邮箱输入框、密码输入框和登录按钮"
AI只生成一个静态页面
Login
没有注册、没有验证、没有错误处理

✅ 系统思维(描述行为)

"创建用户认证系统。注册页收集邮箱+密码,创建用户记录。登录页验证凭据,成功跳转首页。未登录访问内页重定向到登录。密码错误显示提示。支持记住我功能。"
AI生成完整认证流程
1 注册页
邮箱+密码
2 创建用户
写入用户记录
3 登录验证
检查凭据
4 会话状态
记住登录
5 权限保护
未登录跳转
6 错误处理
空值/密码错误
完整流程 · 数据状态 · 权限边界 · 错误反馈

系统思维三要素

数据模型:有哪些对象?字段?关系?
用户流程:谁在什么场景下做什么?
异常边界:空状态、错误、权限、隐私怎么办?

方法三:迭代优化——从"一步到位"到"对话式精进"

低效做法

Round 1:"做个网站"

→ AI给了个基础页面

Round 2:"全部重做,要好看"

→ AI推到重来,丢失之前内容

Round 3:"还是不对,算了"

→ 放弃

有效做法:分层迭代

Round 1 骨架:"做一个产品展示页,顶部导航+中间网格+底部联系"

→ 确认整体结构 OK

Round 2 风格:"改成深色主题,卡片圆角加大,加hover效果"

→ 只改样式,不动结构

Round 3 细节:"导航栏固定顶部,卡片加阴影,字体调大"

→ 精修细节,逐步打磨

迭代黄金法则

1. 先骨架后细节——结构对了再调样式

2. 一次只改一个维度——布局/颜色/内容分步改

3. 保留可用版本——每次大改前留备份

4. 具体反馈——不说"不好看",说"颜色太暗"

方法四:上下文管理——用项目说明固化意图与边界

项目说明:AI的“共享记忆”

复杂项目先写一份计划文档,减少AI在长对话中遗忘目标、改丢边界。

# Project Plan: 个人博客
## 技术栈: HTML+CSS+JS
## 页面结构: 首页/文章页/关于
## 数据模型: 文章{标题,日期,标签,内容}
## 设计风格: 极简,衬线字体,黑白灰
## 功能清单: [搜索] [标签筛选] [RSS]
## 验收: 搜索准确,移动端可用,无敏感数据

分治策略:一次只推进一个可验收单元

不要一次让AI做所有事,每次只做一个完整、可测试、可回退的单元。

1 "先做顶部导航栏——固定、深色背景、三个链接"
2 "在导航下方添加文章列表——卡片式、每行3个"
3 "添加搜索框——实时过滤、防抖、高亮匹配"
4 "添加底部——版权信息、社交媒体链接"

关键时刻:建立检查点

每次完成一个功能,先确认可用,再继续下一个。如果后续改坏了,可以回到上一个稳定版本——不要在没有备份和验收的情况下让AI做大范围重构

AI协作构建能力也存在巨大的差距

主讲人研究生相关课程中期实验测验:一个原本接近工科本科毕业设计工作量的任务,被压缩到 3 小时课堂时间内完成。

测验任务

目标:构建一个 Web 应用,调用云端大模型能力,实现猫咪图片鉴定任务

完整流程:上传图片 → AI 鉴定 → 历史管理 → 可视化图表呈现

能力要求:前端交互、云端模型调用、结果结构化、数据持久化、图表展示

时间压力:3 小时课堂内完成一个原本可作为工科本科毕业设计工作量的系统原型

这不是“写一个页面”的测试,而是对应用架构、模型接入、调试与 AI 协作方法的综合考察。

完成进度:50人班级

0 10 20 20 100 180 分钟 0 2 19 累计完成人数
31
人未完成
180分钟课堂结束

结论:影响构建效率的关键几个要素:应用架构思维(程序员的专业能力)、应用调试能力、AI沟通方法、AI工具选择。

常见陷阱与反模式:生成越快,越要管理风险

陷阱一:一次给太多需求

"做一个有用户系统、支付、聊天、上传、搜索的社交平台" → AI迷失,每样都做不好

建议:每次只做一个完整功能

陷阱二:不提供上下文

"帮我修一下这个bug" → AI不知道你的项目用什么技术栈

建议:告诉AI项目类型、框架、相关文件

陷阱三:让AI大范围重构

"把整个页面重写一下" → 可能引入新bug,丢失已有功能

建议:要求“手术式编辑”,只改需要改的部分

陷阱四:不验证就继续

AI生成代码后直接追加新功能 → 累积的bug最终导致系统崩溃

建议:每完成一个功能就验证一次

陷阱五:信任AI的“假知识”

AI可能"幻觉"出不存在的API、过时的库版本、不安全的实现

要求AI给来源、日期和不确定性;关键事实必须人工复核

陷阱六:忽略合规与伦理

把学生信息、客户资料、未公开文档直接交给工具 → 可能带来隐私和合规风险

先脱敏、再上传;敏感场景使用本地或合规方案

真实趋势:AI协作开发进入主流,但信任正在下降

采用率上升

专业开发者使用或计划使用AI工具约 84%

Stack Overflow 2025 调查显示,AI工具已经成为开发工作中的常规辅助。

对AI输出“信任”的开发者明显不足半数

同一调查也显示,开发者对AI输出准确性的信任下降,说明“会用”不等于“可放心上线”。

从“生成代码”到“治理质量”

定义
目标、场景、数据
生成
原型、代码、文案
审查
事实、逻辑、风险
迭代
反馈、测试、发布

典型案例

设计师 → 产品原型:AI适合快速做可点击样机,但上线前需要工程、可访问性和性能复核。
市场人员 → 内部工具:AI适合做资料整理和数据清洗工具,但涉及客户数据时要先处理权限与脱敏。

来源:Stack Overflow Developer Survey 2025 · Anthropic Economic Index 2025 · NIST GenAI Profile 2024

案例解剖:一个内部工具从想法到可用原型

示例:非技术者用AI构建“资料整理与检索”小工具。重点不是炫技,而是把需求、边界和验收写清。

任务说明
10分钟
目标、用户、数据、验收
骨架
30分钟
上传、列表、搜索、详情
规则
20分钟
字段、标签、空状态
功能
60分钟
搜索、筛选、导出
验收
10分钟
真实数据+边界测试

关键决策点

• 第1次迭代:先做静态原型 → 验证流程是否顺

• 第2次迭代:加入真实样例数据 → 发现字段缺失

• 第3次迭代:补充搜索和标签 → 验证是否找得到资料

• 第4次迭代:处理空状态/错误输入 → 接近可用

更稳妥的交付判断:
AI可以把“可运行原型”做得很快,但内部工具是否能投入使用,取决于数据安全、错误处理、使用说明和维护责任。

核心启示:非技术者构建应用的关键不在“完全不懂技术”,而在能把业务规则讲清楚,并用真实场景验收

与AI协作构建应用——方法论全景

五步方法论

1. 思维转变:你管理AI协作流程,而不是许愿

2. 四要素Prompt:目标+上下文+约束+验收

3. 系统思维:描述行为,而非屏幕

4. 分层迭代:骨架→规则→功能→细节

5. 验证闭环:真实路径+边界输入+风险清单

核心要点

模型投入

为当下优异的、适合该领域任务的 AI 模型服务买单。模型能力本身会大幅提升效果上限。

说明先行:复杂项目先写目标、数据、边界、验收

小步推进:每次只做一个可检查单元

检查点:完成即验证,验证即保留稳定版本

关键公式

清晰意图 + 约束边界 + 真实验证 = 可依赖的AI协作产出

非技术者的真实优势

你更接近真实业务、真实用户和真实约束。把这些说清楚,AI才有可能生成真正有用的东西。

容易误解的一句话:
"AI会帮我把想法直接变成可靠产品"

更准确的说法:
"AI可以加速原型,可靠性来自人的约束、验证和责任"

Codex Agent:自然语言驱动代码生成

OpenAI Codex 是新一代编程 Agent——用日常语言描述需求,AI 自动生成可运行代码。传媒出版从业者无需学习编程,也能快速构建数字工具。

什么是 Codex Agent
• 输入:自然语言描述需求
• 输出:可直接运行的代码 + 执行结果
• 支持:Python、JavaScript、网页开发等
• 特点:具备推理能力,能分步骤解决复杂任务
• 定位:你的"编程实习生"——会写代码、会调试、会解释
传媒出版业三大应用场景
1. 数据新闻可视化
用一句话生成交互式图表页面,嵌入报道中

2. 自动化排版工具
批量处理文档格式、生成目录、统一样式

3. 交互式内容开发
读者调查问卷、动态目录、数据查询页面
核心洞察:Codex 让"意图即代码"成为现实——传媒人只需说清楚业务需求,AI 就能生成技术实现。关键不是学编程,而是学"如何清晰地描述需求"。
🤖 Codex Agent ● 运行中
📊 场景一:数据新闻可视化
生成交互式图表,嵌入报道中 |
思考中...
load_data('sales.csv')
gen_echarts(type='bar', interact='hover')
set_title('2021-2025销售额趋势')
embed_into_article('news_001')
21 22 23 24 25
✓ 已嵌入报道,支持悬停交互
📄 场景二:自动化排版工具
批量排版100篇稿件,统一格式 |
思考中...
batch_format(docx_files, style='standard')
auto_toc(level=3, format='decimal')
unify_font('Noto Sans SC', size=10.5)
export_all(format='PDF', dpi=300)
📑 100篇
原始稿件
📋 目录
自动生成
✅ 统一格式
PDF输出
💻 场景三:交互式内容开发
做个读者调查问卷,带统计图表 |
思考中...
create_survey(questions=5, type='radio')
add_page('dynamic_catalog')
add_search(data_source='articles')
deploy_to('wechat_article')
📋 问卷
5题单选
📑 目录
动态更新
🔍 查询
数据检索
✅ 部署
公众号

从"意图"到"代码":出版业实战案例

以下案例展示了非技术背景的传媒从业者如何用 Codex Agent 解决实际业务问题。

数据新闻页面
需求:将销售数据做成可交互的柱状图
Prompt:"用ECharts生成一个柱状图,展示2021-2025年各季度销售额,支持鼠标悬停显示具体数值"
结果:10秒生成完整HTML页面,可直接嵌入微信公众号
批量格式转换
需求:将100篇Word稿件统一转成EPUB格式
Prompt:"写一个Python脚本,批量读取Word文件,提取标题和正文,按章节生成EPUB电子书,保留原有图片和格式"
结果:一键完成,节省人工排版80%时间
读者互动系统
需求:做一个读者阅读偏好调查问卷
Prompt:"生成一个网页问卷,包含5个单选题和2个多选题,提交后自动统计结果并显示图表,数据导出为Excel"
结果:完整前后端代码,可立即部署使用
非技术者的实践建议:① 先说清楚"做什么"和"给谁用";② 描述输入数据和期望输出;③ 要求代码附带注释说明;④ 小步迭代——先跑通再优化。记住:AI 写代码,你负责判断业务价值。

Agent 实战:智能发票报销全流程

Codex Agent 不仅生成代码,更能调用本地数据、连接审批系统,实现端到端自动化。以下是发票报销的完整 Agent 工作流演示。

🧠 Agent 的核心能力
感知:读取本地文件、识别发票图片
推理:自动提取金额、日期、税号等关键字段
行动:填写报销单、提交审批流、通知用户
记忆:记住个人银行卡信息,下次自动填充
💡 为什么是 Agent 不是工具?
传统工具:你打开 Excel → 手动录入 → 复制粘贴 → 上传审批

Agent 模式:只需说"报销这张发票"→ AI 自动完成所有步骤,包含:读取个人信息、识别发票、校验数据、提交审批。整个过程无需人工干预。
关键洞察:Agent 的颠覆性在于"端到端自动化"——不是帮你填一个表单,而是把整个流程串起来,自主决策、自主执行。传媒人只需说清需求,AI 负责把事做完。
🤖 Codex Agent — 发票报销 ● 执行中
报销这张发票,走差旅费流程 |
📋 步骤一:读取本地个人信息
姓名
张 赟
工号
MEC-2024
部门
媒体工程
开户行
工商银行
银行卡
6222****8888
✓ 已从本地配置文件读取,自动填充
📷 步骤二:发票扫描与识别
发票类型
增值税电子普票
开票日期
2026-06-15
金额
¥1,280.00
税号
9133****4567
✓ OCR 识别完成,准确率 99.2%
🔍 步骤三:智能审核校验
发票真伪验证通过
金额符合差旅标准
税号与开票单位一致
日期在报销有效期内
✓ 4项校验全部通过,无人工干预
🚀 步骤四:提交审批与归档
审批人
李主任
财务
王会计
状态
已提交
✓ 报销单已提交,预计3个工作日到账
THANK YOU

谢谢大家,欢迎交流!

微信二维码

扫码添加微信,继续交流探讨