非技术产品幻想起居录智能记录产品

起居录这款产品是我的幻想，大概一年前左右就有和一些伙伴讨论过。核心点是做日常记录和 AI 分析。但是我没有任何的投入，直到最近看到了 Looki L1 产品，我才发现已经有人做了，于是就将之前整理的一些内容作为博客发布

“起居录”这个产品源于一个朴素的想法：一个人若想自我精进，一条可行的路径便是记录自己每天的所作所为，并加以反思。”起居录”这个名字源于古代皇帝身边设有私人秘书，专门负责记录皇帝每日的言行起居。我的设想是利用现代的摄像头、麦克风等设备进行自动采集，再借助当前 LLM 大模型的技术，在采集完成后进行后续分析。这样一来，自然就能知晓自己一天都做了些什么。进一步扩展，还能在诸多领域带来更广阔的想象空间。例如，在商务场合中，每次会面的内容可以自动记录；出行途中沟通的内容也能自动留存；获得快捷回溯记忆的能力，包括在什么时间点见了什么人、和什么人说了什么话、对方又说了什么话，每日时间分配在哪些事务上，以及口头待办事项的记录。

一开始我是打算联动影石摄像机的，做类似运动相机的方案，分析模块准备以本地为主，也探索在用户同意的基础上，进入云端分析。

但这个方案最大的问题在于：如果开着摄像头，大家说话都会变得很客气。最后我也没有拉到资源，于是就迟迟没有行动。

虽然如此，但对于一些每天面对电脑很多的人来说，除了用摄像机记录现实生活之外，其实这些人群还有一个虚拟的世界也可以记录——那就是电脑屏幕。这部分内容我做了一点原型，技术上也是完全通的，详细请参阅： WPF 结合本地 Ollama 千问多模态实现离线屏幕使用记录工具

以下为 AI 含量成分极大的内容：

路演1：

我们做的是下一代个人智能记录入口级产品「起居录」。

你有没有过见完客户转头忘了对方名字、漏了约定的待办、想不起上周会面的核心细节？国内3亿商务人群每年因为记忆遗漏造成的商务损失超过千亿，现有的记录工具要么需要手动操作打断沟通节奏，要么数据上传云端有严重的商务机密泄露风险。

我们的「起居录」是国内首款端侧隐私优先的穿戴式商务记录神器：不需要用户手动操作，胸挂相机/手机无感自动采集，端侧本地AI自动识别人物、转写对话、提取待办，所有数据100%存在用户本地设备，完全解决隐私焦虑

版本2：

再也不用在会面时手忙脚乱记笔记、再也不用为忘记合作方名字社死尴尬、再也不用担心漏了客户提的核心需求。

我们用最前沿的端侧AI技术打造完全隐私安全的自动记录体系：胸挂设备/手机无感采集，自动识别每一位你接触过的人，转写每一段对话，自动提取待办事项，每天自动生成你的专属商务日记，想找任何历史信息搜关键词1秒就能定位，最核心的是：所有数据只保存在你的设备里，永远不会上传云端，哪怕是我们也拿不到你的任何记录。

把记忆交给AI，你只需要专注当下的沟通。

版本3：

商务人士福音！终于有一款不怕泄露隐私的自动记录神器了！

上个月跑了8场客户会面，转头就忘了张总说Q3要找我谈百万级合作、上次和李总吃饭他提过小孩要升学想找教育资源，全靠脑子记真的会漏事，错过好多机会！

最近挖到的这款「起居录」真的救大命：挂在胸前完全不用管，见了谁自动识别标注，说的话自动转成可搜索的文字，提到的待办自动给你列成清单，晚上自动生成当天的商务日记，所有数据全存在你自己的设备里，根本不上云，再也不怕会见的机密内容泄露！

下半年上线我第一个冲，再也不用当漏事儿的冤种商务人了！

产品需求全案：

第一部分：标准化研发需求（可直接交付产品/技术团队落地）

一、需求背景

面向商务人群打造软硬件结合的自动记录工具，解决商务场景下会面人物、对话内容、待办事项依赖人工记忆容易遗漏的痛点，所有数据优先在端侧处理保障用户隐私，产品支持分阶段迭代上线，不要求一次性完成所有功能。

二、核心目标

第一阶段实现商务人士日常出行、会面的全链路自动记录、智能归档、快速检索，完全替代人工记录避免信息遗漏，所有隐私数据默认本地存储，无用户主动授权绝不上传云端。

三、适用范围

目标用户：第一阶段仅服务商务人士
载体范围：采集端适配市售开源胸挂运动相机、手机；呈现端为电脑端；暂不对接第三方现有工具

四、功能清单（优先级标注）

P0（第一阶段必做）

采集适配：支持主流安卓/iOS手机、市售开源胸挂运动相机的音视频采集对接
端侧智能能力：端侧人物识别、端侧ASR对话转写、端侧声纹匹配识别
内容管理：人物标注命名功能、音视频按时间/人物自动归档、对话内容向量化存储+关键词快速检索
商务场景能力：自动识别对话中待办事项并分类汇总、每日自动生成结构化日常记录日记
隐私保障：所有数据默认本地加密存储，无后台静默上传行为

P1（第二阶段迭代）

闲时算力调度：夜间设备空闲时自动完成视频裁剪、内容总结、数据索引优化
陌生人提示：采集完成后界面提示所有未标注陌生人，引导用户完成命名归档
事件维度聚合：支持按单场会面/事件维度整合所有相关的人物、对话、待办内容

P2（远期规划）

智能眼镜硬件适配
自媒体内容生产减负功能
用户主动授权前提下的多端数据同步

五、非功能要求

性能要求：人物识别响应延迟≤2s，中文普通话ASR转写准确率≥95%，向量化检索响应≤1s
兼容性：采集端适配市面TOP3款开源胸挂运动相机、主流中高端安卓/iOS手机；呈现端支持Windows/macOS双系统
算力要求：所有P0功能可在中端以上手机/带NPU的运动相机端侧独立运行，无需依赖云端算力

六、交付周期评估

第一阶段（P0功能上线）：需求确认后16周，其中端侧AI能力适配8周、前后端功能开发5周、全链路联调测试3周
第二阶段（P1功能上线）：P0上线后8周
远期功能按需追加开发周期

产品功能点：

识别人脸，给出面向的人的信息提示
记录声纹，分辨是谁说了什么话
记录事情，自动总结
- 自动提取信息
- 自动提取待办内容
  - 随口待办功能
    - 某些待办如果是给 AI 去做的，将自动分配空闲时间自动让 AI 去干活
提供查询功能
- 物品查找功能：每天看到的东西都能记录起来，可以询问我最后一次看到 Xx 东西时是在什么时候。随后就可以查询记忆和视频，分为浅层检索和深度记忆检索阶段，先从每日总结里面提取快速的信息，随后再在遍历历史视频寻找物品
提供提醒功能：到什么地点、什么时间、见到什么人给出什么提醒
- 即当见到某个人的时候，如果有预设提醒，则给出提醒；到某个地点的时候，如有提醒则给提醒。提醒信息可由“自动提取待办内容”等模块提供。如：下回我到这家店的时候，提醒我做什么。下回我见到某人的时候，提醒我做什么

最佳的形态是眼镜的形态

本文会经常更新，请阅读原文： https://blog.lindexi.com/post/%E9%9D%9E%E6%8A%80%E6%9C%AF-%E4%BA%A7%E5%93%81%E5%B9%BB%E6%83%B3-%E8%B5%B7%E5%B1%85%E5%BD%95%E6%99%BA%E8%83%BD%E8%AE%B0%E5%BD%95%E4%BA%A7%E5%93%81.html ，以避免陈旧错误知识的误导，同时有更好的阅读体验。

如果你想持续阅读我的最新博客，请点击 RSS 订阅，推荐使用RSS Stalker订阅博客，或者收藏我的博客导航

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。欢迎转载、使用、重新发布，但务必保留文章署名林德熙（包含链接： https://blog.lindexi.com ），不得用于商业目的，基于本文修改后的作品务必以相同的许可发布。如有任何疑问，请与我联系。

无盈利，不卖课，做纯粹的技术博客

以下是广告时间

推荐关注 Edi.Wang 的公众号

欢迎进入 Eleven 老师组建的 .NET 社区

以上广告全是友情推广，无盈利

« dotnet OpenXML 读取 PPT 主序列进入退出强调动画从 Visual Studio Copilot 的请求内容学习其实现原理 »

lindexi