起居录这款产品是我的幻想,大概一年前左右就有和一些伙伴讨论过。核心点是做日常记录和 AI 分析。但是我没有任何的投入,直到最近看到了 Looki L1 产品,我才发现已经有人做了,于是就将之前整理的一些内容作为博客发布

“起居录”这个产品源于一个朴素的想法:一个人若想自我精进,一条可行的路径便是记录自己每天的所作所为,并加以反思。”起居录”这个名字源于古代皇帝身边设有私人秘书,专门负责记录皇帝每日的言行起居。我的设想是利用现代的摄像头、麦克风等设备进行自动采集,再借助当前 LLM 大模型的技术,在采集完成后进行后续分析。这样一来,自然就能知晓自己一天都做了些什么。进一步扩展,还能在诸多领域带来更广阔的想象空间。例如,在商务场合中,每次会面的内容可以自动记录;出行途中沟通的内容也能自动留存;获得快捷回溯记忆的能力,包括在什么时间点见了什么人、和什么人说了什么话、对方又说了什么话,每日时间分配在哪些事务上,以及口头待办事项的记录。

一开始我是打算联动影石摄像机的,做类似运动相机的方案,分析模块准备以本地为主,也探索在用户同意的基础上,进入云端分析。

但这个方案最大的问题在于:如果开着摄像头,大家说话都会变得很客气。最后我也没有拉到资源,于是就迟迟没有行动。

虽然如此,但对于一些每天面对电脑很多的人来说,除了用摄像机记录现实生活之外,其实这些人群还有一个虚拟的世界也可以记录——那就是电脑屏幕。这部分内容我做了一点原型,技术上也是完全通的,详细请参阅: WPF 结合本地 Ollama 千问多模态实现离线屏幕使用记录工具

以下为 AI 含量成分极大的内容:

路演1:

我们做的是下一代个人智能记录入口级产品「起居录」。

你有没有过见完客户转头忘了对方名字、漏了约定的待办、想不起上周会面的核心细节?国内3亿商务人群每年因为记忆遗漏造成的商务损失超过千亿,现有的记录工具要么需要手动操作打断沟通节奏,要么数据上传云端有严重的商务机密泄露风险。

我们的「起居录」是国内首款端侧隐私优先的穿戴式商务记录神器:不需要用户手动操作,胸挂相机/手机无感自动采集,端侧本地AI自动识别人物、转写对话、提取待办,所有数据100%存在用户本地设备,完全解决隐私焦虑

版本2:

再也不用在会面时手忙脚乱记笔记、再也不用为忘记合作方名字社死尴尬、再也不用担心漏了客户提的核心需求。

我们用最前沿的端侧AI技术打造完全隐私安全的自动记录体系:胸挂设备/手机无感采集,自动识别每一位你接触过的人,转写每一段对话,自动提取待办事项,每天自动生成你的专属商务日记,想找任何历史信息搜关键词1秒就能定位,最核心的是:所有数据只保存在你的设备里,永远不会上传云端,哪怕是我们也拿不到你的任何记录。

把记忆交给AI,你只需要专注当下的沟通。

版本3:

商务人士福音!终于有一款不怕泄露隐私的自动记录神器了!

上个月跑了8场客户会面,转头就忘了张总说Q3要找我谈百万级合作、上次和李总吃饭他提过小孩要升学想找教育资源,全靠脑子记真的会漏事,错过好多机会!

最近挖到的这款「起居录」真的救大命:挂在胸前完全不用管,见了谁自动识别标注,说的话自动转成可搜索的文字,提到的待办自动给你列成清单,晚上自动生成当天的商务日记,所有数据全存在你自己的设备里,根本不上云,再也不怕会见的机密内容泄露!

下半年上线我第一个冲,再也不用当漏事儿的冤种商务人了!


产品需求全案:

第一部分:标准化研发需求(可直接交付产品/技术团队落地)

一、需求背景

面向商务人群打造软硬件结合的自动记录工具,解决商务场景下会面人物、对话内容、待办事项依赖人工记忆容易遗漏的痛点,所有数据优先在端侧处理保障用户隐私,产品支持分阶段迭代上线,不要求一次性完成所有功能。

二、核心目标

第一阶段实现商务人士日常出行、会面的全链路自动记录、智能归档、快速检索,完全替代人工记录避免信息遗漏,所有隐私数据默认本地存储,无用户主动授权绝不上传云端。

三、适用范围

  1. 目标用户:第一阶段仅服务商务人士
  2. 载体范围:采集端适配市售开源胸挂运动相机、手机;呈现端为电脑端;暂不对接第三方现有工具

四、功能清单(优先级标注)

P0(第一阶段必做)

  1. 采集适配:支持主流安卓/iOS手机、市售开源胸挂运动相机的音视频采集对接
  2. 端侧智能能力:端侧人物识别、端侧ASR对话转写、端侧声纹匹配识别
  3. 内容管理:人物标注命名功能、音视频按时间/人物自动归档、对话内容向量化存储+关键词快速检索
  4. 商务场景能力:自动识别对话中待办事项并分类汇总、每日自动生成结构化日常记录日记
  5. 隐私保障:所有数据默认本地加密存储,无后台静默上传行为

P1(第二阶段迭代)

  1. 闲时算力调度:夜间设备空闲时自动完成视频裁剪、内容总结、数据索引优化
  2. 陌生人提示:采集完成后界面提示所有未标注陌生人,引导用户完成命名归档
  3. 事件维度聚合:支持按单场会面/事件维度整合所有相关的人物、对话、待办内容

P2(远期规划)

  1. 智能眼镜硬件适配
  2. 自媒体内容生产减负功能
  3. 用户主动授权前提下的多端数据同步

五、非功能要求

  1. 性能要求:人物识别响应延迟≤2s,中文普通话ASR转写准确率≥95%,向量化检索响应≤1s
  2. 兼容性:采集端适配市面TOP3款开源胸挂运动相机、主流中高端安卓/iOS手机;呈现端支持Windows/macOS双系统
  3. 算力要求:所有P0功能可在中端以上手机/带NPU的运动相机端侧独立运行,无需依赖云端算力

六、交付周期评估

  1. 第一阶段(P0功能上线):需求确认后16周,其中端侧AI能力适配8周、前后端功能开发5周、全链路联调测试3周
  2. 第二阶段(P1功能上线):P0上线后8周
  3. 远期功能按需追加开发周期

本文会经常更新,请阅读原文: https://blog.lindexi.com/post/%E9%9D%9E%E6%8A%80%E6%9C%AF-%E4%BA%A7%E5%93%81%E5%B9%BB%E6%83%B3-%E8%B5%B7%E5%B1%85%E5%BD%95%E6%99%BA%E8%83%BD%E8%AE%B0%E5%BD%95%E4%BA%A7%E5%93%81.html ,以避免陈旧错误知识的误导,同时有更好的阅读体验。

如果你想持续阅读我的最新博客,请点击 RSS 订阅,推荐使用RSS Stalker订阅博客,或者收藏我的博客导航

知识共享许可协议 本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。欢迎转载、使用、重新发布,但务必保留文章署名林德熙(包含链接: https://blog.lindexi.com ),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请 与我联系

微软最具价值专家


无盈利,不卖课,做纯粹的技术博客

以下是广告时间

推荐关注 Edi.Wang 的公众号

欢迎进入 Eleven 老师组建的 .NET 社区

以上广告全是友情推广,无盈利