白鲸出海—让中国互联网服务世界

{{user_info.user_name}}
您当前是白鲸会员
开通VIP,享受更多服务
会员到期时间:{{user_info.expire_date*1000 | formatDatebyDay}}
合作查看次数: {{users_vip_equities.view_cooperation || 0}}次
合作发布次数: {{users_vip_equities.release_cooperation || 0}}次
公司查看次数: {{users_vip_equities.view_company || 0}}次
报告下载次数: {{users_vip_equities.download_book || 0}}次
鲸币数量:{{user_info.jingbi}}
发布
当前位置:白鲸出海 > 资讯 > 正文

在国内AI语言赛道做到第一后,我们又做了一款“顺人性”的新产品|对话创始人

kevinzha  • 

以下文章来自 Z Potentials,作者 Z Potentials

全球语言学习,一个将在 2032 年突破 2000 亿美元的庞大市场,其核心却建立在一个“反人性”的基石之上:枯燥、孤独、易放弃。无数 App 试图用游戏化、用碎片化来“欺骗”大脑,但终究无法回避学习过程中的那段“必须独自穿越的黑暗隧道”。今天,我们对话的 Midoo 团队,正试图用 AI Agent 这一“新物种”,从根本上颠覆这个行业的底层逻辑。他们不想只做一盏更亮的“矿灯”,而是想成为那个能与你并肩、为你照亮整条隧道的“同行者”。

这场对话,我们试图剥去产品发布的喧嚣,进行一次深入的探寻。我们向创始人 Mark 和产品合伙人 Leo 抛出了数十个问题,涵盖哲学、战略、技术与商业的方方面面。我们不仅关心 Midoo 是什么,更关心它为何而来,它如何应对那些最尖锐的挑战,以及它所畅想的未来,究竟是教育的福音,还是又一个美丽的泡沫?欢迎开启这场关于下一代语言学习范式的对话!

第一部分:原点与哲学——为什么要再出发?

“个性化学习是无数教育从业者希望去解决的问题,Agent 的出现让我们意识到真正把个性化带给用户的时机到了,这是一件无与伦比的事情。”

ZP:请 Mark 介绍一下自己,并且和我们讲一讲 TalkAI 做到国内第一的创业故事吧。

Mark:大家好,我是 Midoo 创始人 Mark,在广东沿海城市长大,因为成长环境有一帮经商的亲戚,从 16 岁开始就觉得要自己做点什么,18 岁通过做网站赚到钱对我冲击非常大,让我坚定互联网是我们这代人最大的机会。

后来就一直在创业,也走了不少弯路,22 岁和 26 岁两次创业都失败了。27 岁的时候,我停下来复盘,给自己定了三条原则:第一,市场空间要足够大;第二,这件事必须是我发自内心热爱的;第三,我的认知要能比大多数人高一点。 按照这个框架,我选择了教育行业,后来做的 Xnote、闪记卡也都实现了盈利,证明了这套思考是有效的。

23 年初 GPT 的出现,对我产生了很大的影响。我意识到,计算机历史上第一次真正拥有了“脑力”,这个新能力的出现,一定会推动产生不亚于互联网时代的商业价值。我们选择了立刻开始 AI+教育方向,2 月底完成 TalkAI 立项,4 月上线,5 月就实现了盈亏平衡。在没有外部融资的情况下,我们开创了赛道并且在 1 年时间就做到了赛道第一。

这是一个不错的成绩,但我心里也很清楚:当前所有的 AI 产品都只是一个中间态,离真正的成功还差得很远。 今天最让我激动的地方,不是回头看我们过去的成绩,而是往前看——我们这样一个小团队,能够和所有互联网巨头站在同一起跑线上,拥有同样的机会去定义 AI 时代的下一个超级应用。这在过去是不可想象的。

ZP:也请 Leo 介绍一下自己过去的工作和创业经历。

Leo:大家好,我是 Leo。我和 Mark 一样,成长在广东沿海,我一直相信技术和产品能够真正改变人的生活。我的职业生涯一直在研究“AI如何赋能人类”。

在腾讯,我探索的是 AI+医疗健康,从健康档案到慢病管理,我看到了 AI 在处理复杂生命信息上的潜力。而在字节跳动,我负责抖音的智能服务和监控平台,这段经历让我真正深入到了大规模 AI 系统的腹地。特别是在 2021 年,我就开始尝试将大模型应用于预测和监控场景,这让我对 AI 的底层能力和未来可能性,有了更深的直觉和体感。

2023 年,我选择离开字节,全身心投入创业,因为我看到一个更直接、更高效的路径去实现我的理念。无论是早期的 AI 信息助手,还是后来作为联合创始人从 0 到 1 推动的 AI 浏览器 Fellou,我的目标都非常聚焦:如何借助 AI,让复杂的信息获取更简单,让知识的学习更高效?

对我来说,每一次再出发的动力都来自于这种信念:AI 不只是技术,它是帮助人类释放潜能的关键。

ZP:TalkAI 已经非常成功,从商业角度看,团队完全可以躺在功劳簿上。再次选择出发,驱动你们的是更大的商业机会,还是一个具体的问题?如果是后者的话,那个问题是什么?

Mark:在 TalkAI,我们用 5 个人的团队开创了AI口语赛道,做到了几千万的营收。用户非常认可 TalkAI 在练口语上提供的帮助,但后台数据显示,他们中的许多人依然会慢慢沉寂。

这让我反复思考:如果用户放弃的原因不是工具不够好,那持续优化工具的终点在哪?我最终得到的答案是:问题的根源在于“千人一面”的学习模式。传统模式下,所有用户都被迫走在一条预设好的、僵化的道路上。这就像我们打造了一把最高效的“斧子”,却发现森林里只有一条崎岖难行的路,无论用户的目的地是哪里,都必须走这条路。这才是导致他们孤独、挫败并最终放弃的核心。

那一刻我意识到,真正的革命不是造一把更锋利的斧子,而是要为每个人动态地生成一张属于他自己的、通往目标的最佳地图。这个信念,就是 Midoo 的设计哲学的原点——“动态课程”。我们坚信,Agent 是解决个性化学习的关键,它是唯一能够实现这一愿景的技术范式。所以,我们决定出发,打造全球首个主动式 AI language learning agent,为全世界的学习者提供真正个性化、沉浸式、有趣有温度的语言学习体验。

这个使命,决定了我们必须秉持“Day One Global”的理念。当然,这也是一个理性的商业判断:海外市场的规模足够大,在订阅模式下,整个盘子可能是国内的 50 倍以上。

也正因为我们要彻底地实现这个全球化使命,Midoo 才必须是一个完全独立的新团队。我们很幸运,这个构想在立项阶段就获得了互联网大厂创始人和多位一线基金合伙人的种子轮投资。这笔资金让我们能从第一天起就心无旁骛地朝着我们内部的目标前进:三年内,成为全球第一的 AI 语言学习产品。

1d4dfe4cb6980e355839ea555c70f16f.png

ZP:你反复提到当下学习的“反人性”。这是一个很深刻的洞察。能否请你解构一下,“反人性”具体包含哪些元素?Midoo 的设计哲学,是如何通过“动态课程”这一核心来系统性解决这些痛点的?

Mark:我们内部对“反人性”有过大量的讨论和拆解,我们认为它源于一个错误的假设:即所有人都可以被标准化的内容所驱动。这个假设直接导致了几个核心痛点,按权重排序是:孤独感 > 挫败感 > 枯燥感 > 犯错恐惧

最致命的是孤独感。这种孤独不仅仅是“没人陪”,更是“没人懂你”。当你被硬塞进一个与你的目标和兴趣毫无关系的课程时,那种格格不入的感觉,才是最深的孤独。

其次是源于反馈缺失的挫败感。一个固化的、非动态的系统,根本无法告诉你,你个人到底进步了多少,距离你的个人目标还有多远。这种无力感是第二大杀手。

然后才是枯燥感。这几乎是“非个性化”的必然结果。当内容不是为你而生时,它对你来说就是枯燥的。

所以,Midoo 的设计哲学,就是用“动态课程”这一核心武器,去消解用户对于“犯错”的恐惧。因为你是在一个完全为你定制的、安全有趣的环境里探索,犯错成了一种宝贵的反馈数据,而不再是可怕的审判。

ZP:“Agent”是当下最热门的词汇,但也因此变得模糊。请用 Midoo 的语境,给“Language Learning Agent”下一个清晰的、可被衡量的定义。它必须具备哪三个核心特质,才能被称为一个合格的“学习 Agent”,而非一个更聪明的“学习 Tool”?

Leo:这是一个非常好的问题,在我们看来,一个合格的“学习 Agent”必须具备三个核心支柱,缺一不可:

主动路径规划 (Proactive Pathfinding): 工具是被动的,像一张静态的纸质地图,你必须自己找到位置,规划路线。Agent 是主动的,像车载 GPS,它会基于对你的长期观察和即将到来的日程,主动为你规划和调整学习路径。它会说:“Mark,我发现你下周要去东京出差,并且你的日历上有一个重要的商务会议。我们今天来模拟一下机场、酒店的对话,并重点演练一下你们行业的商务谈判术语,怎么样?”

沉浸式情景互动 (Immersive Interaction): 工具提供的是孤立的练习题,像健身房里冰冷的器械。Agent提供的是一个动态的、有上下文的“场景剧场”,像一个全息模拟训练舱。你不是在“练”肌肉,而是在一场虚拟的篮球赛中“用”肌肉去得分。你是在接近真实世界的互动中“使用”语言,而不是“学习”语言。

共情式伙伴关系 (Empathetic Partnership): 这是最核心的区别。工具是冰冷的,它不在乎你的情绪、Agent次是有温度的,它能从你的语气、反应速度中感知到你的进度和情绪,提供个性化的鼓励和情感支持,与你建立一段“成长关系”。它记得你上次的挫败,也分享你这次的喜悦。

没有这三点,“Agent”都只是工具的智能升级版,无法触及学习的灵魂。

第二部分:产品与技术——“理想”如何照进现实?

“我们追求的不是绝对的自由生成,而是‘戴着镣铐的舞蹈’,是在教育学框架内的最大个性化。”

关于“动态生成”的深度追问

ZP:“动态生成学习路径”是核心卖点,但也是双刃剑。教育的本质是“有结构的知识传递”。一个完全动态、实时的路径,如何保证其系统性和连贯性?你们如何避免学习过程变成一场“随机的、碎片化的漫游”?

Mark:我们采取的是内部称为“骨架+血肉 (Bone & Flesh)”的混合模式。我们在不同的语言学习场景都构建了非常严谨的知识图谱和能力层级模型,来保证用户学习的系统性和底层逻辑,确保每一个知识点都被覆盖,并且被循序渐进地交付给用户。

而 AI Agent 所做的,是在这个确定的“骨架”之上,根据用户的兴趣(他喜欢科技还是艺术?)、目标(他是为了留学还是商务?)和实时表现(他在哪个知识点上卡住了?),去动态填充千人千面的“血肉”。比如,骨架决定你今天需要学习“虚拟语气”这个语法点,但“血肉”可以是 Midoo 和你讨论“如果恐龙没有灭绝,世界会怎样?”,也可以是帮你准备一场商务谈判:“如果我们拥有无限预算,我们的营销方案会怎么做?”。这样既保证了教学的严谨性,又实现了最大程度的个性化和趣味性,学习过程是“形散而神不散”,看似自由漫游,实则每一步都在我们构建的知识地图上稳步前行。

1596773e4d1c92f345d2634238d7cd93.png

关于“沉浸式场景剧场”的边界探索

ZP:“沉浸感”与“学习效率”有时是矛盾的。过于真实的场景可能会增加学习者的认知负荷,导致他们专注于“玩”而非“学”。你们在产品设计中,如何找到“沉浸感”和“有效学习”之间的黄金平衡点?

Leo:我们的核心理念是“目标驱动式沉浸 (Objective-driven Immersion)”。我们不认为沉浸感和效率是矛盾的,而是统一的。关键在于场景设计的“任务闭环”。每个场景剧场都有一个明确的学习目标和需要完成的任务。比如,在“餐厅点餐”场景,你的任务就是成功点到你想要的菜品,并正确结账。在这个过程中,你被迫调动所有语言能力去解决问题,这就是最高效的学习。

我们后台评估的不是你“玩”了多久,而是你解决问题的效率、语言运用的恰当性以及目标达成率。沉浸感是手段,达成目标才是目的。场景结束后,Agent 会立刻生成一份复盘报告,告诉你:“这次交流很成功,但你在表达‘五分熟’时用词可以更地道一些,试试‘medium rare’?” 这样就把沉浸式体验和高效学习完美结合在了一起。

ZP:真实世界的对话充满“意外”。如果用户在场景中持续“不按套路出牌”,甚至故意破坏对话,Agent 的“容错机制”和“引导机制”是怎样的?

Leo:这恰恰是我们最兴奋的地方!我们称之为“压力测试 (Stress Test)”。我们的 Agent 拥有基于角色的“动机系统 (Motivation System)”。如果在一个严肃的商务谈判场景,你突然开始聊哲学,Midoo 会进行即时的、符合逻辑的反应。它可能会礼貌地表示困惑,并尝试将话题拉回到议程上:“That's a fascinating point, and I'd love to discuss it over a coffee sometime. But perhaps we could focus on the Q3 budget for now to make the most of our scheduled time?”这种引导是柔性的、符合社会常识的,它本身就是一种高级的语言教学。当然,如果用户持续破坏,Midoo 也会判断这是一次无效学习,并建议开启一个新的、目标更明确的场景。我们允许用户探索边界,因为真实世界就是如此,而我们的 Agent 要做的,就是成为那个最高级的陪练。

关于“有温度的情感伙伴”的伦理拷问

ZP:AI 的“人设”由谁来定义?是统一的、标准化的“Midoo 性格”,还是用户可以高度自定义?如果允许自定义,当用户试图创造一个有潜在负面影响的“导师”时,你们的规则和底线是什么?

Leo: 这是一个我们从第一天起就在严肃思考的伦理问题。要回答这个问题,首先需要理解我们对“伙伴关系”的模块化设计。Midoo 的主体角色是一个高效的学习计划管理助手,它的核心是专业、可靠。而在助手之外,我们设计了一整套与用户深度互动的“学习伙伴” Agent 体系:有的 Agent 专注于提供丰富的学习建议,像一位策略导师,帮你规划路径;有的 Agent 负责提供个性化定制内容,像一位创意总监,确保你的学习素材永远有趣且相关;还有的 Agent 则专门提供情感支持,像一位温暖的同伴,在你需要时给予鼓励。

关于“人设”,我们提供的不是一个单一的性格选项,而是整个伙伴体系的互动风格。用户可以选择一个总体的“基调”,比如“鼓励型”、“严谨型”或“风趣型”。这个基调会影响所有伙伴 Agent 与你沟通的方式,从而形成一种统一、和谐的陪伴体验。

我们绝不允许用户创造有辱骂、PUA 或任何负面引导倾向的 Agent。Midoo 的AI背后有一套严格的伦理审查和安全护栏机制,确保每一个伙伴 Agent 的互动都以“促进用户积极成长”为唯一目标。正是通过这个专业化的 Agent 团队协同工作,我们才能真正做到让语言学习不再孤独,让整个旅途充满温暖和趣味。技术向善,是 Midoo 不可动摇的基石。

第三部分:市场与竞争——在红海中开辟新航道

“我们的对手不是 Speak 和 Praktika,而是 Duolingo 和 TikTok。我们是在用‘成长的快乐’去竞争‘即时的快乐’。”

ZP:你们“Day One Global”的愿景非常宏大。在具体策略上,你们选择将东亚(日韩)和北美作为首批同步推进的市场,这是一个非常独特的组合。能否为我们解读一下,同时在两个文化和竞争格局迥异的市场开战,背后的战略考量是什么?

Mark:这是一个相辅相成的、支持我们 Day One Global”愿景的策略组合,这两个市场分别扮演着不同的关键角色。

首先,东亚(日韩)是我们的“高价值增长引擎”。 这里有三个无与伦比的优势:

1. 极强的学习动机与付费能力: 在日韩,无论是商务、留学还是职场晋升,对英语学习的需求都是绝对的刚需,用户有强烈的意愿为“确定性的结果”支付高溢价。

2. 文化上的深度契合: 这两个市场都属于高语境文化,用户对于“导师 (Sensei/선생님)”和“伙伴”的角色有天然的尊重和接受度,能立刻理解我们产品超越工具层面的核心价值。

3. 营销机会的结构性错位: 这里的竞争远未饱和,现有竞品的营销打法相对传统,广告素材同质化严重。我们有信心用更先进的社媒内容营销和规模化的红人矩阵实现“降维打击”,以极高的效率获取高质量用户。

与此同时,北美是我们的“全球标准定义场”。

1. 市场的风向标: 北美是全球语言学习最大、最成熟的市场,付费习惯和对创新产品的接受度都是全球最高的。在这里获得成功,就等于拿到了定义全球行业标准的入场券。

2. 最激烈的试金石: 与全球最强的对手同台竞技,能迫使我们的产品在技术、体验和商业模式上打磨到极致。能在北美立足,证明我们的产品是世界级的。

所以,同步推进这两个市场,对我们来说是一个完美的战略闭环:用东亚市场的高效增长和盈利能力,为我们在北美这个“主战场”的持续投入提供充足的弹药;同时,在北美市场被验证的世界级产品标准,又能反过来对东亚市场形成更强的品牌势能。 这就是我们实现全球第一目标的、最稳健也最快速的路径。

ZP:让我们做一个思想实验:如果明天,Duolingo 宣布投入 1000 名工程师,用他们亿级的用户数据,做一个完全一样的 AI Agent 产品,并免费开放。Midoo 的防御壁垒是什么?

Mark:这是一个非常好的问题,也是我们向投资人回答过无数次的问题。我们的核心壁垒不是代码,而是“数据的维度”和由此产生的“关系的深度”。

Duolingo 的数据,本质上是关于“人如何做对或做错题”的数据。它是离散的、浅层的、非交互的。而Midoo 从第一天起,积累的就是“人如何在特定场景下进行有上下文的、长轮次的、充满情感和动机的真实对话”的数据。这种数据的维度、深度和质量是完全不同的,它是和模型侧结合构建一个懂用户、懂交流、懂教育的系统唯一的燃料。

更重要的是,当一个用户和他的 Midoo 导师已经共同“经历”了上百个场景,AI 记住了他的所有高光和窘迫时刻,形成了独特的互动模式和情感记忆,这种“羁绊”是无法被任何巨头用免费模式轻易复制和抢走的。我们的护城河,短期看是产品和技术,长期看,是 AI 与用户之间建立的、不可量化但极其坚固的“信任关系”。

第四部分:商业与终局——通往未来的地图

“语言学习只是我们解开的第一个束缚,我们的最终目标,是赋能每一个个体的无限成长。”

ZP:一个理想的 Midoo 用户,他会在你们的平台上停留多久?如果用户真的“学成毕业”了,这对于一个依赖持续订阅的商业模式来说,是好事还是坏事?

Leo:我们从不认为语言学习存在“毕业”一说,这是一种工业时代的线性思维。语言是活的,是流动的,需要终身维持和进化。一个用户可能用 3 个月,在 Midoo 的帮助下成功搞定了去硅谷出差的商务交流,达到了阶段性目标。但这之后,他可能会有新的需求:他想去伦敦生活,需要学习地道的英式俚语;他爱上了莎士比亚,想看懂原著,需要提升古典词汇;他的孩子要上国际学校,他想和外教无障碍交流。

Midoo 的价值在于成为一个“终身语言伙伴”。用户“毕业”了一个阶段性目标,我们会和他一起庆祝,并为他开启下一个更激动人心的目标。我们的商业模式,建立在陪伴用户“终身成长”的价值之上,而非一次性的课程售卖。用户的成功,是我们商业模式的燃料,而不是终点。

ZP:语言学习之外,你们看到的第二个、第三个可以被这套“Agent 导师”方法论改造的领域是什么?这是否意味着 Midoo 的终局,是一家“AI 驱动的个人成长公司”?

Mark:你完全看到了我们的星辰大海。语言学习是最佳的“试验场”,因为它完美融合了知识(词汇语法)、技能(听说应用)和情感互动(交流信心)。我们坚信,在 Midoo 上验证成功的这套 Agent 框架——个性化路径生成、沉浸式场景模拟、共情式伙伴关系 ——未来完全可以应用到更广阔的个人成长领域。

想象一下:一个即将进行重要演讲的 CEO,可以在 Midoo 里和一个模拟的、由数百位挑剔投资人组成的“虚拟董事会”反复演练;一个程序员新手,可以有一个 7x24 小时的AI编程导师,陪他写代码、debug;一个销售新人,可以在高压的“客户拒绝”场景中锻炼自己的应变能力。

所以,是的,Midoo 的终局,绝不止于语言。我们的使命是“Language Unbound, Connection Unleashed”,语言只是我们解开的第一个束缚。我们的最终目标,是成为一家“AI 驱动的个人成长公司”,为每一个渴望进步的个体,提供一个属于他自己的、无所不能的AI导师团。

ZP:最后,请坦诚地告诉我们,在通往这个宏大愿景的路上,你个人认为,Midoo 最有可能在哪件事上失败?

Mark:如果说最让我警惕的风险,只有一个:我们是否能真正地、持续地,让“成长的过程”变得和“娱乐的过程”一样有吸引力?技术实现、市场竞争,这些都是可以克服的战术问题。但最核心的战略挑战是,我们是在和人性中最强大的惯性——对安逸和即时满足的追求——作斗争。如果我们最终只是做出了一个“稍微有趣一点”的学习工具,而不是一个用户发自内心“渴望与之共度时光”的成长伙伴,那我们就失败了。这是我们团队每天都在拷问自己的终极问题,也是我们所有努力的最终指向。


文章信息来自于Z Potentials,不代表白鲸出海官方立场,内容仅供网友参考学习。对于因本网站内容所引起的纠纷、损失等,白鲸出海均不承担侵权行为的连带责任。如若转载请联系原出处。

友情提醒:白鲸出海目前仅有微信群与QQ群,并无在Telegram等其他社交软件创建群,请白鲸的广大用户、合作伙伴警惕他人冒充我们,向您索要费用、骗取钱财!


分享文章

扫一扫 在手机阅读、分享本文

21026
{{votes}}
分享文章

扫一扫 在手机阅读、分享本文

21026
{{votes}}

要回复文章请先登录注册

扫描二维码,加入各大平台
致力于为出海开发者提供一手资讯、干货知识

与CEO聊合作

(备注姓名、公司及职位)