来源_迈慕财务 发文日期_2024年01月02日
好消息!2022年7月份增值税留抵退税申请时间延长了
正文 斯坦福美女博士创业项目:半年融资5500万美元 这样的效果,也使得公司成立仅半年,产品用户已经超过52万人。更是新斩获5500万美元融资,其中个人投资者不乏各种大牛。 斯坦福华人博士休学搞创业,直接火爆AI圈!新产品瞄准AI视频生成,刚出道就成行业顶流,引来一众大佬围观评价。OpenAI大牛Andrej Karpathy转发,并激情附上长文一段:每个人都能成为多模态梦境的导演,就像《盗梦空间》里的筑梦师一样。就连Stability AI创始人也来点赞:这个新产品名为Pika1.0,背后公司Pika于今年4月成立。要知道,这一行的产品已有不少,如成立5年的Runway等公司。在AI视频生成“乱花迷人眼”的当下,这个新产品究竟是如何做到迅速破圈,吸引大量关注度的?从放出的Demo效果来看,Pika 1.0不仅能根据文字图片,流畅地生成一段视频,动静转换就在一瞬间:而且可编辑性还特别强,指定视频中的任意元素,一句话就能实现快速“换装”:这样的效果,也使得公司成立仅半年,产品用户已经超过52万人。更是新斩获5500万美元融资,其中个人投资者不乏各种大牛,如Quara创始人Adam D’Angelo、Perplexity的CEO Aravind Srinivas、GitHub前CEO Nat Friedman等等。所以,Pika究竟有没有看起来这么好用?我们也立刻上手体验了一番。1、AI视频新顶流长啥样?此次火爆出圈的Pika 1.0,是Pika发布的*个正式版本产品。经过四个多月Discord社区的测试,Pika认为是时候推出本次重大升级了。相比之前Pika还只能用文字或图像生成视频,如今的Pika 1.0,功能要更加丰富——不仅能根据文字、图片或视频风格生成视频,还能对视频局部进行编辑??杀嗉杂卸嗲??不仅画面大小任意扩展,从5:2、1:1画布,到9:16以及16:9的超大屏,4种选择无缝转换:像什么3D、动漫、电影等各式各样的风格滤镜,那就更不用说了。最重要的是,1.0正式版推出了用户更友好的网页版,不用在discord中一遍遍艾特机器人,就能直接上手玩。当然,也可以移步Discord社区先上手体验一番。尽管它还未随网页版更新到Pika 1.0,但我们也实测了一下文字、图片生成视频的效果,还不错。加入社区之后,直奔“Creations”,从下面的10个生成区随便选择一个进入即可开耍。在输入框中输出“/”,选择最简单的“/create”命令:在此,我们输入“a robot dancing in the rain, sunset, 4k, -gs 8”提示词交给机器人。大概也就半分钟的时候,视频就出来了,速度相当快:?效果嘛,雨没有表现得很明显,但机器人的肢体动态性真的很强。我们再来一个稍微长一些的提示词:a teenager walks through the city streets,takes pictures of places(一个青少年穿过城市的街道,拍摄照片)仍然超级快,结果就出来了:Wow,这次真的有很满意,画面符合脑海中的预测,甚至比我们想象得还要好。除了纯文字,咱还可以上传一张参考图像进行创作,使用“/animate”命令。当当,一张静态表情包就动起来了:总的来看,Pika给出的视频时长都是3s(所以使用太长的提示词也没用,后面会直接忽略掉),以及它还不能保证每次结果都很满意,但总体来说多试几次还是有不错的结果出现的。在自测之外,我们也来看看网友的作品,其中不乏非常惊艳的效果。比如有人创作的这只小怪兽,憨态可掬,让人忍不住想摸一把:还有这段两位小女孩的演奏画面,看完我好像真的听到了优美的嗓音从中传出:最绝的还是这个白鸽围绕短发美女翻飞的场面:也太有氛围感了吧~看罢如上效果,我们也来盘盘这家公司究竟是什么来头。2、两位斯坦福华人博士创立Pika的创始人一共有两位,郭文景(Demi Guo)和Chenlin Meng,都是斯坦福博士。据The Information消息,郭文景于今年四月创立了Pika,随后Chenlin Meng加入成为联创,两人合作开发了这个文本生成视频模型。从二人学术经历来看,她们分别专注于NLP和计算机视觉两个方向的AI研究,也都有生成式AI的学术经历。联合创始人兼CEO郭文景,斯坦福大学AI实验室(NLP 图形学方向)博士。她在美国出生,杭州长大,初中就读的是杭州外国语学校,从小就接触编程,夺得过IOI银牌,从本科开始正式留学,被哈佛大学提前录取。此次创业,她的领英主页显示休学中(On Leave),应该是打算先忙创业的事情。在斯坦佛大学读博之前,郭文景在哈佛大学取得了计算机硕士和数学本科学位。在本科期间,她曾经gap过一年,专程在Facebook AI Research全职做了一段时间的研究工程师。在职期间,她参与了用Transformer分析2.5亿个蛋白质序列的研究,目前这篇论文引用已有1200+,其中就包括后来大火的AlphaFold2:除此之外,她也先后在Epic Games、谷歌和微软等多家公司实习过。这次创业,郭文景的导师Christopher D Manning也给予了不少支持。Christopher D Manning以NLP方向的研究闻名,如今在谷歌学术上的引用量已有23w+,而他也将成为Pika的学术顾问之一。联合创始人兼CTOChenlin Meng,同样是斯坦福计算机博士。在此之前,她于2020年在斯坦福大学获得了数学本科学位。相比郭文景在NLP领域的研究经验,她在计算机视觉、3D视觉方面的学术经历更加丰富,参与的去噪扩散隐式模型(DDIM)论文,如今单篇引用已有1700+:除此之外,她还有多篇生成式AI相关研究发表在ICLR、NeurIPS、CVPR、ICML等顶会上,且多篇入选Oral。当然,随着Pika 1.0爆火,Pika也开启了进一步的招人计划,从技术、产品到运营都有需求:3、一个月内5家产品亮相值得一提的是,不止是正在快速扩张的Pika。就AI视频这个行业而言,这段时间来整体都迎来了一段“爆发期”。据不完全统计,从11月至今,短短一个月的时间就已经有5家AI视频生成产品发布或迎来大更新:首先就是11月3日,Runway的Gen-2发布里程碑式更新,支持4K超逼真的清晰度作品。然后时间来到11月16日,Meta发布Emu Video,这个工具在用户评估中号称打败Gen-2、Pika等对手,效果be like:从Emu开始,大家都好像打起比赛来了,那叫一个争先恐后。才过两天,11月18日,字节就半路杀出发布PixelDance,作品的动态性可谓史无前者,画面中的元素都动作幅度都相当大,且不变形,让人眼前一亮。又仅过3天之后,11月21日,AIGC领域的佼佼者Stable AI也终于推出了自家的视频工具:Stable Video Diffusion。效果嘛,也很能打。同一天,Gen-2又没闲着,“横插一脚”上线“涂哪动哪”的运动笔刷新功能,直接标志出生成模型可控性上的一个重要里程碑。最后,就是今天了,11月29日,来自创业公司的Pika直接带着网页版发布正式版1.0,叫板“老大哥”Runway。在此之外,我们还从未见过哪个阶段有这么多各有特色、来自不同背景的产品争相亮相。这也让人不得不感叹一句:AI视频这是来到爆发前夜了? 【本文由投资界合作伙伴微信公众号:量子位授权发布,本平台仅提供信息存储服务。】投资界处理。「狐狸」阿里,「刺猬」拼多多
正文 那些止步于2023年的AI创业项目 被埋没的产品成果当然远不止上述这些,可能还会有更多的AI产品消失在路上。如果非要有什么秘诀的话,那就是在AI时代,永远不要停止对AI原生应用的探索。 要说今年什么创业项目/公司最性感,和AI相关的一定榜上有名。在这场由ChatGPT引发的AI技术浪潮中,创业者们的脸上同时写满兴奋和焦虑。OpenAI、Midjourney、Stability AI等明星AI公司估值狂飙、风光无限,国内的AI领域也早已展开激烈竞争,截至上个月,仅国内公开的AI大模型数量,就已高达238个。除了大厂外,中小创业团队和独立开发者们也纷纷涌入AI领域,希望能够抓住这个历史性的机遇,打造出具有影响力和价值的产品或服务。聚焦细分市场应用的小型AI产品层出不穷,整个AI创业领域呈现出一片繁荣态势。然而,繁荣之下必有泡沫,一个残酷的现实是,大多数AI创业项目都可能难逃失败的命运。“很多AI创业团队脑袋一热加班加点搞的东西,用不了几天就会失去意义。”一位AI创业者告诉“头号AI玩家”。11月的OpenAI开发者大会,更是直接宣告了一堆AI创业公司的死亡。零一万物CEO李开复在“MEET2024智能未来大会”上预判,不包含大厂在内,中 美相加最后将有五、六家大模型公司笑到最后。国外有一个叫做“AI Graveyard(AI坟墓)”(https://dang.ai/ai-graveyard)的网站,记录了近200个目前已经停止运营的AI项目。这些项目夭折的原因是什么?创业者如何避免重蹈覆辙?AI创业的长期价值落点在哪?“头号AI玩家”对其中几个典型项目的功能、技术实现形式和失败的原因进行了分析,希望能给各位AI玩家提供启发。AI创业项目的几种“死法”YC(Y Combinator)曾总结过创业公司的18种死法,具体到AI创业也依然适用。概括来说,基本离不开太烧钱、不赚钱、没算力、产品没有竞争力和差异性,这些大家耳熟能详的原因。而具体到AI Graveyard中的一些小项目,失败的原因则集中于:市场需求评估不准确、商业模式不可持续、技术实现不成熟等。AI创业者需要从这些失败案例中吸取教训,避免重蹈覆辙。1. AI搜索引擎:NeevaNeeva是一个人工智能驱动的搜索引擎,主打一个无广告和优先考虑用户隐私。它由谷歌前高管Sridhar Ramaswamy和Vivek Raghunathan于2019年创立,2023年5月宣布关停,并被Snowflake收购。?不可否认,AI+搜索引擎,是一门好生意。曾经的Neeva产品官网AI驱动的搜索引擎可以更好地理解自然语言查询,包括对复杂查询的深度理解和上下文分析,从而提供更准确和相关的搜索结果。但在搜索引擎市场,像谷歌、微软这样的巨头已经占据了主导地位,拥有庞大的用户基础和深厚的技术积累。构建一个与市场领头羊竞争的搜索引擎,是一场重资本游戏。而且,用户对现有搜索引擎(如谷歌、必应等)的依赖已经形成了稳固的使用习惯。要使用户转向新的搜索引擎,需要提供显著优越的搜索体验,在搜索结果的相关性、速度、界面设计等方面达到或超越用户的期望。此外,找到有效的盈利模式也是一个重大挑战。依靠广告收入可能难以与市场*竞争,而其他盈利模式(如订阅服务)可能难以吸引大量用户。在数据隐私和安全越来越受到重视的今天,新的搜索引擎还需要确保其能够保护用户的隐私和数据安全,这不仅是一个技术和法律问题,更涉及到品牌认知和用户信任的建立。2. AI搭讪台词生成器:AI Pickup LinesAI Pickup Lines可以生成各种主题和风格的搭讪开场白,2022年年底上线,2023年3月初网页就被关闭了。曾经的Pick up lines产品官网用户可用Pick up Line每天免费生成10条搭讪文案,订阅计划每月9.99美元或每年99.99美元,可以生成无限数量的搭讪台词,并且可以灵活地选择任何关键词。还可以以499.99美元的价格购买综合数据库,数据库包含100000多行内容,涵盖各种主题和风格。这是一个典型的基于大语言模型的包装和简单应用,类似的还有AI周报生成器、AI哄女友文案生成器等。在大语言模型能力逐渐增强和普及的情况下,这类产品的壁垒会越来越薄。而且这类产品通常娱乐性大于实用性,更多地被视为一种娱乐产品,而不是一个实用工具。虽然可以在短期内吸引用户的好奇心,但可能缺乏长期的实用价值。AI生成的搭讪用语显然不足以应对现实生活中复杂多变的社交情境,包括社交互动中的微妙情感和非语言因素。在盈利模式方面,虽然这类产品可能通过广告或一次性购买获得收入,但长期的用户留存和盈利能力是一个挑战。如何让用户持续使用并从中获得价值,是这类应用需要解决的问题。3. AI照片编辑工具:PhotoFix根据检索到的信息,PhotoFix.io创建于2022年年初,网站于2023年4月初维护关闭。PhotoFix的主要功能是:提高照片质量、清晰度;增强分辨率;删除照片中的元素,例如人物、物体或背景;文本生成图像,例如《绝命毒师》、吉卜力动画和逼真的肖像。然而,AI照片编辑软件市场已经接近饱和,许多成熟的产品如Adobe Photoshop、Lightroom以及各种移动应用已经占据了市场主导地位。再加上Lensa AI、EPIK等众多AI写真软件对用户的教育,如果一个新的AI照片编辑工具没有显著区别于现有的产品,可能难以吸引用户。4. AI生成游戏模拟器:FablesimulationFablesimulation的创建时间已经不得而知,它于2023年3月21日被收录进“AI Graveyard”项目。这是一个在线平台,允许用户在虚拟环境中进行编程、训练以及与智能体交互。Fablesimulation的最终目标是建立一个拥有100万人工智能的繁华在线元宇宙,人们可以在那里生活、工作,甚至建立浪漫关系。虽然它倡导的概念看起来很有创意和前瞻性,但是并没有经过充分的验证和测试,没有明确的目标用户和场景。而且它需要用户在虚拟世界中编程、训练智能体,这无疑提升了用户参与门槛,同时在技术实现难度、商业模式的可持续性、安全性和隐私问题、硬件要求、社会伦理问题等多方面也面临挑战。避免AI项目失败,需要做什么?“护城河”是很多开发者、投资人喜爱的术语,它指明了一家企业如何阻止竞争对手夺走自己的业务。但并不是所有的AI初创企业都能在其中找到自己的“护城河”。据“头号AI玩家”分析,这些失败的AI产品大多是典型的AIGC应用方向,但在各自领域里同质化严重,无法和竞品拉开差距。当然,还有一些产品因为资金投入不足,投入成本过高,陷入了困境。1. 要找准细分市场,打造产品壁垒生成式AI的快速崛起让更多开发人员可以将AI功能添加到自己的产品中,不用再重新构建模型。“接入API”的方式,带来了一批新的人工智能初创企业。在API的帮助下,只需设计前端的产品页面,就能在平台上构建相应的AI产品。大多数开发人员都在OpenAI、Mistral等企业的帮助下,构建了大大小小的应用程序。不过,这样的方法不可避免会面临平台带来的风险。OctaneAI联合创始人Ben Parr表示,OctaneAI曾接入Facebook Messenger的聊天机器人技术,但Facebook陷入数据泄漏丑闻后,突然禁止任何开发者在Messenger上创建聊天机器人,这在一定程度上为开发者带来了产品风险。再以Jasper.ai为例,它是建立在GPT基础上的AI初创企业,从年初预计全年收入达1.5亿,到开启裁员模式,不过短短半年时间。原因无他,Jasper.ai的产品基于GPT-3模型开发,而GPT-4的出现使其遭受了技术碾压,就此陨落。数据网站Semrush统计显示,自从GPTs发布以来,同类型产品的网络流量已经下降了一半以上。小冰公司首席执行官在“Meet2024智能未来大会”上提到:“API调用并没有体现出生成式人工智能的创造力价值”。就像Ben Parr在经历过风险后所总结的,“尽量不要做API平台也可以自行构建的产品”。比如,开发者可以制作一个聊天机器人,但用的是OpenAI无法获取的数据库,像大量的绘画素材、策划方案、医疗数据、邮件内容等等。相比构建大模型,拥有自己的数据集,成本相对更低,也能因此筑起产品壁垒。另外,打造针对某个特定垂直领域的产品,明确自己的受众群体,比起横向延伸AI产品功能更具优势。上述失败的AI产品大多是普适性较强的工具,可以面向所有公众,但这也导致了产品无法做出差异化。大型科创企业可以投入更多资金、更大算力打造通用型AI工具,挤压初创公司的生存空间。独立开发者飞侠告诉“头号AI玩家”,“无论什么赛道,聚焦在特定垂直领域的产品肯定更具优势,专门的数据、借口、合规方式都是大型企业无法提供的。”Githhub就曾上线了面向开发者的Copilot,尽管新模型是由OpenAI、Azure AI联合打造,但它为开发者人群打造了一个专门的编码类生成式AI工具。Github Copilot再比如之前流行的产品“AI大藏经”(佛经GPT),它的开发者另辟蹊径,找准了一条冷门的垂直赛道。Stripe产品负责人Sahar Mor认为,打造用户更易用的功能更具实际意义,针对特定细分市场的垂直初创企业会继续保持主导地位。2. 筹集足够的资金,或投入较低的成本“烧钱”是很多AI产品研发都会提到的关键词。但美国知名风投a16z的分析报告指出,月访问量排名前50的生成式AI产品,几乎有一半没有引入任何外部资本,都是自己筹集的资金。来源:a16z构建和训练自有模型往往需要花费上百万人民币,而对现有模型进行微调,或是集成GPT模型的应用,能够节省更多的费用。也就是说,进行AI产品研发的团队可以选择较低的成本投入。《增长黑客》作者范冰在一期播客中提到:“(AI赛道)融资很多很猛,烧钱更多更猛”。这么想来,缺少资金也不失为一种“反向布局”的办法。还有一些开发者以“你不理财,财不离你”来形容在AI产品上的资金投入。“头号AI玩家”也咨询了一些开发者和创业团队,不考虑人力成本和后续商业变现的情况下,零成本也可以启动一个项目。比如在GitHub上不少以GPT为技术原型的套壳项目,潜在收益高,最早一批的“中间商”,已经实现月入十余万元。不过,融资难或许是今年AI领域的普遍现象。有投资人曾开玩笑,线下创投会说得最多的是“好的,再看看”。据此前“小饭桌”报道,AI创业者Steven表示很多投资人其实是在假装看AI。当然,对于一些开发者来说,产品本身才是更重要的,商业模式通常会被后置。“虽然现在没有筹到钱,但先获得一些稳定的用户,让他们自愿付费,这是我们接下来的小目标。”飞侠说道。无论是资金不足还是缺少技术壁垒,比这些问题更重要的前提是要抓住用户需求。YC创始人Paul Graham认为,“从某种意义上说,导致创业失败的原因就只有一个,就是没人需要你做的东西”。个人独立开发者则热衷钻研AI技术的各种创新玩法。专注在目标用户群上,找准自己的产品定位,所有创业成功的原因都可以归结于此。被埋没的产品成果当然远不止上述这些,可能还会有更多的AI产品消失在路上。如果非要有什么秘诀的话,那就是在AI时代,永远不要停止对AI原生应用的探索。 【本文由投资界合作伙伴新榜授权发布,本平台仅提供信息存储服务。】投资界处理。比亚迪首家储能公司诞生