07

2024

-

25

又一AI独角兽获战略投资;曝苹果与OpenAI合作或将采取分销;小爱同学接入豆包手机SU7已搭载丨情报局

来源:鹅电竞直播    发布时间:2024-07-25 11:33:17


  思谋以视觉检测为切入点,致力于AI视觉体系架构在人机一体化智能系统、超高清视频领域的落地应用。港司与思谋集团在香港进行战略合作签约。

  晶泰科技在港交所主板挂牌上市:晶泰科技是一家以计算驱动创新的药物研发科技公司,基于前沿计算物理、量子化学、A与云计算技术,为全世界创新药企提供智能化药物研发服务。在港交所主板挂牌上市。

  (欢迎添加微信AIyanxishe2,了解更多AIGC、融资情况,与志同道合的朋友一同畅聊时新AI产品)

  国家网信办公开发布第六批境内深度合成服务算法备案信息。本次共有 492 个算法通过备案,这中间还包括腾讯混元大模型多模态算法、零一万物大模型多模态生成算法、快手快意大模型生成合成算法、商汤V-ME视频合成算法、钉钉AI助理智能生成算法等、绘蛙电商模特试装图像合成算法等。

  小米旗下AI助手“小爱同学”与火山引擎达成合作,双方基于豆包大模型实现更智能的AI交互体验。小爱还能借助字节跳动豆包大模型提供的联网搜索插件能力,实时捕获与头条内容同源的搜索出来的结果,呈现全面且时效性强的答复。

  中文在线近期在互动平台上宣布,旗下“中文逍遥”大型生成式人工智能模型已成功通过相关备案,并已对部分合作作者开放服务。“中文逍遥”大模型具备内容生成能力,能够一键生成万字,一张图写出一部小说,一次读懂100万字小说。

  复旦大学NLP实验室LLMEVAL团队发布2024年高考数学大模型评测的结果。在新Ⅰ卷中,阿里千问和讯飞星火对14道数学客观题的准确率达到70%以上,大幅领先GPT-4o的57%,字节豆包、智谱清言、百川等大模型紧随其后,准确率超过50%,百度文心一言、腾讯元宝、Kimi等大模型准确率较低。

  而在在新Ⅱ卷的评测中,讯飞星火、阿里千问、GPT-4o准确率均超过60%,其他大模型的差距较小,除百川、DeepSeek和海螺之外,准确率均在50%以上。

  火山方舟上的豆包全系模型都将为个人用户更好的提供 50 万 tokens 的免费推理额度,此外豆包通用模型 pro 和豆包通用模型 lite 的 4K 和 32K 版本,也为用户更好的提供了 1 万 RPM(每分钟请求数)和 80 万 TPM(每分钟 tokens 数)的流量额度。免费额度用完后,以豆包通用模型 pro-32k 版为例,模型推理输入价格为 0.0008 元 / 千 tokens。此外,个人开发者还可以上传数据集,通过 SFT 精调、继续预训练对模型进行精调。

  中国香港特区政府设立的一支持有620亿港元的基金机构“香港投资管理有限公司”,宣布与 AI 独角兽思谋集团签定战略合作协议。后续计划建立香港首个 AI 研究院,加强对 AI 领域的支持,推动大模型创新在大湾区的应用,并提升香港在 AI 和智能制造领域的发展。

  王仲远博士认为,当前美国政府对于中国 AI 技术发展加以限制,然而,美国只会延缓,但不会阻碍中国 AI 技术的长期发展,所以,《ENFORCE 法案》对于中国 AI 技术发展不会产生特别大的影响。

  国际数据公司IDC发布《中国大模型市场主流产品评估,2024》,从基础能力到应用能力7大维度对11家大模型厂商的16款市场主流产品做实测。结果显示,百度位于第一梯队,是唯一一家在7大维度上均为优势厂商的企业。百度旗下生成式AI产品文心一言和文心一格在问答理解类、推理类、创作表达类、数学类、代码类的基础能力,toC通用场景类、toB特定行业类的应用能力等7大维度均具备优势。

  美图创始人、董事长兼CEO吴欣鸿,在美图影像节上展示了奇想大模型视频生成的最新效果,透露下个月将推出进阶版本。在他看来,生成时长不是AI视频产品最核心的能力。基于大模型底层能力,他们推出AI短片创作平台MOKI,将于7月31号上线。

  360新品发布会“被盗图人”喊话周鸿祎,要求公开道歉 赔偿1元RMB:DynamicWangs还补充自己是 unsplash 的摄影师,使用的是自己的摄影作品和 unsplash 的图片作为训练集,没有版权争议。

  字节扣子模型广场上线,模型届的「竞技场」:扣子模型广场提供三种对战形式,让用户出题,模型实时 PK,根据表现评判并投票揭秘。

  阿里巴巴开源AI图像编辑融合框架MimicBrush:允许用户在源图像上指定需要编辑的区域,并提供一个包含期望效果的参考图像进行图片编辑,支持如对象替换、样式转换、纹理调整等图像编辑操作。

  The Information 消息,山姆・奥特曼对员工表示,在过去约六个月的时间里,公司年化营收达到了 34 亿美元,相比去年年底翻了一番。奥特曼还提到,OpenAI 通过微软 Azure 提供人工智能模型接入,也有望获得约 2 亿美元的营收。据悉,OpenAI 在 2023 年底时的年化营收还只有 16 亿美元,去年夏天时约为 10 亿美元。

  OpenAI 在社交平台 X 上回应了与甲骨文的合作伙伴关系,称其与微软的战略性云合作伙伴关系不变,与 OCI 的合作使其能够在 OCI 的基础设施上使用微软的 Azure AI 平台做推理等操作,所有前沿模型的预训练仍在与微软合作构建的超级计算机上进行。

  彭博社消息,苹果尚未就聊天机器人功能与中国本土AI供应商达成协议,但一直在考虑与百度、阿里巴巴集团等公司合作。

  此外还披露了苹果与OpenAI合作的财务条款。据悉,初期合作并不包括真金白银。苹果希望未来和 OpenAI 等公司分账 AI 相关业务收入,OpenAI、谷歌等企业来提供各种 AI 服务,苹果将继续扮演“平台”的角色抽取佣金分成。

  微软称不是所有 Windows 用户都能获得该 AI 功能,因为对硬件有要求,至少需要 40 TOPS 及以上算力 NPU 的 Copilot+ PC,即要花费 7984 元购买骁龙 X 机型才行。使用该功能需登录微软账户并联网以访问云服务。

  特斯拉人形机器人部门 Tesla Bot 发布了数十个高薪职位,该部门负责微调完全无人驾驶软件并提升人形机器人的能力。同时,特斯拉还在制造、法律、运营、软件等多个领域开放了职位。

  Luma AI宣布开放 Dream Machine 视频模型测试,可免费试用。该模型能从文本和图像生成“高质量”视频,120 秒可生成 120 帧,目前单个视频最长 5 秒,生成的视频具有逼真的流畅运动、电影摄影和戏剧效果,还可以匹配摄像机运动。

  该模型包含20亿参数,在图像质量上有显著提升,能够生成更高质量、更细腻的图像。能够更准确地将文本描述转换为图像,模型的尺寸较小,能够在消费级PC和笔记本电脑以及企业级GPU上良好运行。

  Translation Agent利用反射式代理工作流程和 LLM 技术提供高度定制化的翻译服务,为用户更好的提供灵活设定语气、地区特色和专业术语表的翻译体验。该项目的可定制性和灵活性将推动 AI 智能体在机器翻译领域的广泛应用。

  苹果的CEO库克称“我们从未有过让人们将所有时间都花在我们的设备上的想法。我们的成功并不依赖于用户使用设备的时间长短。我们的目标是赋予用户更多的能力,让他们可以做到以前没办法完成的事情。”他还补充,随着Apple Intelligence的功能日益强大,许多原本需要大量时间才能完成的任务现在可以迅速完成。

  OpenAI首席技术官Mira Murati表示,他们非常关心用户的隐私和产品安全性,公司不会和苹果共享用户数据,OpenAI也不会使用苹果用户数据训练大模型。

  Suno正式对外发布音频输入功能,可以用任何声音创作歌曲:允许用户从任何声音中创作歌曲。这项创新的功能为专业版和高级版用户开放。

  Mozilla 升级 AI 建站服务 Solo:增加了更多动画选项,提高了网站制作的美观度,并放宽了字符限制,同时支持最多上传 30 张图片。

  AI 图片大赛闹乌龙,真实照片竟意外斩获两个奖项:摄影师将拍摄的火烈鸟照片提交给 1839 大奖的 AI 组别,却意外获得评委奖铜奖和观众票选奖。但赛事主办方之后更改了获奖名单,将奖项颁给了另外两幅 AI 生成图像。

  日本初创公司 Carelogy 推出养宠 App:这款 App 能判断猫咪何时感到疼痛,由此减少了用户推测何时需要带猫咪去动物医院所承受压力的次数。开发者表示,这款应用的准确率超过 95%,随着 AI 识别更多猫咪面孔,其准确率还有望进一步提高。

  Namify.tech是一个利用AI技术帮助用户生成品牌名称、检查域名和商标注册,并提供LOGO设计服务的平台。它通过提供易于使用的名称生成工具和专业的人建议,帮助用户快速找到并确立品牌身份。网站还强调了新域名扩展的优势,并提供了针对不一样的行业的名称生成器,以满足多种用户的需求。

  LeRobot 的目标是为现实世界的机器人技术提供模型、数据集和工具,降低进入机器人领域的门槛,使更多人能够共享数据集和预训练模型。这一个项目集成了最先进的方法,关切模仿学习和强化学习,已被证明能够转移到现实世界。

  Revideo 是一个基于 Motion Canvas 的开源框架,专为程序化视频编辑而设计,很适合开发者构建复杂的视频工作流程或在浏览器中创建视频编辑器。它为视频制作带来了新的可能性,特别是在自动化和实时编辑方面。

  Revideo 提供了一个框架,允许开发者使用 TypeScript 创建视频模板,并通过向模板传入数据(如文本、图片、视频或复杂数据结构)自动生成视频内容。开发的人能即时预览视频,并在浏览器中实时编辑,最终将视频导出为 MP4 格式。该框架支持大规模创建视频,适用于广告 A/B 测试、集成视频编辑功能到现有应用或开发视频游戏等多种用例。此外,Revideo 鼓励用户加入其社区,提供了 Discord 群组和文档资源来获取帮助和最新更新,并展示了社区项目,邀请用户分享自己的项目以获得展示机会。

  idootop/mi-gpt 是一个开源项目,通过将小爱音箱接入 ChatGPT 和豆包,转变为个性化的语音助手,实现智能家居的升级和优化。它集成了 AI 问答、角色扮演、流式响应、长短期记忆和自定义 TTS 等功能,让小爱音箱可提供广泛的知识回答、即时的交互体验,并记住用户的对话需求。项目提供 Docker 和 Node.js 两种启动方式,适合不同技术背景的用户,并配备详细的文档教程,涵盖参数设置、普遍的问题解答、本地开发指南和更新日志等。未来,idootop/mi-gpt 还将实现智能家居设备间的自动化配合,逐步提升居家生活体验。

  ProAI.co 提供一款由AI驱动的商业计划生成器,旨在帮助初创企业和中小企业快速制定定制的商业计划和市场研究报告,同时提供财务预测、成长策略和融资指导,以数据驱动的洞察力推动企业未来的发展。平台利用从 3600 多个客户项目中学习到的知识,为用户更好的提供包括利润与损失、现金流量、资产负债表等在内的完整财务模型,以及针对性的营销、销售和产品计划。

  深入洞察和个性化支持:AI 顾问可提供针对性的产品路线图、招聘计划和内容创作服务,并通过数据支持的市场分析、竞争对手分析和关键洞察力,帮企业做出明智的决策。该平台还通过数据支持的讲故事方式、针对性的外联和专家咨询等方式,帮企业吸引资金。多个行业专家推崇该平台,并确保数据安全和合规性,用户都能够通过免费试用的方式开始利用 AI 商业计划生成器,推动企业增长。

  ARC Prize 是一个由 Mike Knoop 和 François Chollet 主办的公共竞赛,旨在通过解决 ARC-AGI 基准来推动人工通用智能(AGI)的进展。竞赛提供超过 100 万美元的奖金,包括 50 万美元的终极大奖和 10 万美元的进步奖金,以及尚未公布的 50 万美元奖金。竞赛将于 2024 年 6 月 11 日开始,目前已启动。

  如果你想了解如何让用户爱上你的产品,Kevin Hale 的这堂课绝对不容错过!他是 Wufoo 的创始人,分享了许多关于建立用户关系和产品开发的宝贵经验。

  第一印象和使用者真实的体验:产品的第一印象至关重要,要通过设计和使用者真实的体验给用户留下深刻印象。

  长期关系维护:借鉴婚姻研究,理解如何维持长期用户关系,避免批评、蔑视、防御和阻挠。

  AI情报局征集线人,付费收集独家价值线索!如果您能够给大家提供有关AI最新成果&行业内幕&独特产品,请添加运营微信号:AIyanxishe2备注行业岗位。

  微软CopilotGPTs将停服,发布3个月或因无法盈利斩杀;美国限制中国获取新AI芯片技术;前壁仞总裁创立魔形智能丨AI情报局

  多家AI公司获融资;字节秘密启动AI手机研发,锤子手机和PICO VR团队领衔;国内首个Sora级视频生成模型诞生丨AI情报局

  苹果AI登场,与OpenAI合作,Siri将采用GPT-4o;全球AI独角兽达37家;OpenAI自研芯片进展曝光丨AI情报局