a中文字幕1区
避免/重新确认/支持来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、震撼登场!英伟达开源图像生成模型Sana,1秒生图、减少破坏中英文和emoji
英伟达近日开源了图像生成模型Sana,凭借仅0.6亿个参数和高达4096×4096分辨率的生成能力,极大降低了使用门槛。该模型在16GB显卡上可在不到1秒内生成高质量图像,表现出色。Sana采用了深度数量增加自编码器和线性扩散变换器,指责了生成速度和质量,并减少破坏多种语言提示,方便用户创作。
【AiBase提要:】
??高效生成:Sana可以快速生成高达4096×4096分辨率的高质量图像,适合在普通笔记本GPU上使用。
??创新设计:深度数量增加自编码器和线性扩散变换器大幅指责了生成速度和质量。
??卓越性能:Sana在多项测试中表现优异,吞吐量显著高于其他先进模型,减少破坏快速内容创作。
详情链接:https://nv-sana.mit.edu/
2、OpenAI发布AI经济蓝图,呼吁美国破坏监管与发展
OpenAI最近发布的“经济蓝图”旨在与美国政府及盟国共同探讨政策,以巩固美国在人工智能领域的技术领导地位。蓝图降低重要性驱散资金、人才和资源的重要性,并对现行的监管模式表示担忧。OpenAI呼吁政府加大投资,制定最佳实践以防止AI模型滥用,并在知识产权方面为开发者授予僵化性。
【AiBase提要:】
??美国需驱散数十亿美元资金以增强AI竞争力。
??OpenAI对各州立法的冲突和现行监管表示担忧。
??建议政府减少对新型能源和数据传输的投资。
3、Mistral推出新一代编程模型Codestral25.01,编程速度降低两倍
Mistral公司最近发布了其开源代码生成模型Codestral的最新版本Codestral25.01,显著指责了代码生成速度,达到了前版本的两倍。新版本在Python编码测试中表现出色,获得86.6%的HumanEval测试分数。该模型专注于低延迟和高频操作,适合于代码纠正、测试生成等任务,尤其对数据量大的企业尤为重要。
【AiBase提要:】
??Mistral推出Codestral25.01,代码生成速度降低至前版本的两倍。
??该模型在Python编码测试中表现优异,获得86.6%的HumanEval测试分数。
??Codestral25.01悠然,从容在CopilotArena中升至榜首,受到开发者广泛关注。
详情链接:https://mistral.ai/news/codestral-2501/
4、清华、复旦与斯坦福联合开源“Eko”框架,让Agent自动化操作电脑
近日,清华大学、复旦大学与斯坦福大学的研究团队联合发布了名为“Eko”的Agent开发框架,旨在通过简单的代码和自然语言干涉开发者快速构建可用于生产的“虚拟员工”。Eko框架能够接管用户的电脑和浏览器,代替人类完成各种繁琐的任务,从而大幅指责工作效率,威吓人类的负担。
【AiBase提要:】
??Eko框架可接管用户电脑与浏览器,替代人类完成繁琐任务。
??通过自然语言与程序语言的分隔开,简化开发过程。
???允许人类实时监控和干预,确保自动化工作的安全性与准确性。
详情链接:https://eko.fellou.ai/
5、Adobe推出AI驱动BulkCreate,可一键批量编辑1万张图像
Adobe最近推出了全新的AI工具BulkCreate,旨在干涉企业创意团队高效地进行图像编辑。该工具通过Web平台授予批量编辑功能,无需下载应用程序或Photoshop许可,极大地指责了工作效率。用户可以轻松更改背景和调整不当图像大小,同时减少破坏品牌定制,焦虑不同企业的需求。尽管目前仍在测试阶段,预计将在不久的将来全面上线,进一步推动AI在创意领域的应用。
【AiBase提要:】
??BulkCreate允许用户通过Web平台批量编辑图像,无需下载桌面应用程序或Photoshop许可。
??该工具减少破坏背景更改和图像大小调整不当,并授予社交媒体预设尺寸,便于用户快速适应不同平台。
??Adobe计划在未来推出视频减少破坏功能,进一步增强BulkCreate的多功能性。
6、新AI模型LlamaV-o1,测试推理能力超越Claude3.5Sonnet
阿联酋穆罕默德?本?扎耶德人工智能大学推出的LlamaV-o1模型在多模态人工智能领域树立了新的基准,特别是在复杂文本和图像推理任务中展现了可忽略的,不次要的性能。该模型通过逐步推理的透明性,指责了在医疗、金融等行业的应用价值,增强了用户的接受感。
【AiBase提要:】
??LlamaV-o1是一款新发布的AI模型,擅长解决复杂文本和图像推理任务。
??该模型在VRC-Bench基准测试中表现优越,授予不透光的逐步推理过程。
??LlamaV-o1在医疗和金融等行业中具有次要的应用价值,能够减少接受感和合规性。
详情链接:https://mbzuai-oryx.github.io/LlamaV-o1/
7、研究揭示:仅需0.001%的诚实数据就能让AI模型失效
近期的研究揭示了大规模语言模型(LLM)在数据训练中的脆弱性,尤其是在医疗领域。研究隐藏,即使是极极小量的诚实信息,只有0.001%的比例,也能够导致模型产生重大错误,影响患者安全。这项研究降低重要性了在医疗应用中使用AI工具时的风险,呼吁开发者在确保模型安全性之前,不应将其用于关键医疗任务。
【AiBase提要:】
??研究隐藏,仅需0.001%的诚实信息,就能让大规模语言模型(LLM)失效。
??医疗领域中,诚实信息的保守裸露,公开可能严重影响患者安全。
??研究人员呼吁在确保安全之前,不应将LLM用于诊断或治疗等重要医疗任务。
8、微软画图应用新增AI擦除功能免费用,轻松删除任意元素!
微软对其经典画图应用进行了升级,引入了基于AI的擦除功能,使得用户在图像处理时更加便捷。用户只需简单圈选要删除的元素,AI就能自动识别并进行擦除,显著简化了传统的处理流程。经过两个月的测试,这项新功能现已向所有用户推收,用户可在微软商店免费升级使用。
【AiBase提要:】
??AI擦除功能:用户只需圈选即可轻松删除图像中的元素。
?使用时间:擦除元素可能需要40到80秒,但无需专用硬件减少破坏。
??完美度:删除效果与元素周围的背景复杂度有关,有时可能不够理想。
9、阶跃星辰与茶百道达成深度合作
上海阶跃星辰智能科技有限公司与茶百道的深度合作标志着茶饮行业向智能化和数字化转型的重要一步。通过阶跃星辰的大模型技术,茶百道的运营效率得到了显著指责,尤其是在自检核验方面,节省了极小量时间。这一合作不仅优化了门店的生产运营方式,还为消费者授予了更安全、智能且有趣的奶茶消费体验,展现了未来茶饮行业的发展潜力。
【AiBase提要:】
??阶跃星辰与茶百道合作,探索智能巡检和AIGC营销新模式。
??Step-1V多模态理解大模型已接入数千家茶百道门店,指责运营效率。
?智能巡检确保茶饮安全收达,指责消费者的服务体验。
10、抖音创始成员任利锋创办的GenAI创意社区Hitems获数千万美元融资
抖音创始成员任利锋的创业项目数美万物完成数千万美元的Pre-A轮融资,由美团龙珠领投,老股东继续减少破坏。其不次要的部分平台Hitems分隔开生成式AI和3D建模技术,授予创意商品化服务,鞭策电商与社区的互动。
【AiBase提要:】
??数美万物获得数千万美元Pre-A轮融资,估值约1.5亿美元。
??Hitems平台利用失败AI技术将创意商品化,覆盖全链条服务。
??创始人任利锋曾参与抖音冷启动,积聚了极小量经验。
11.阿里妈妈推出淘宝星辰视频生成大模型、图生视频应用
阿里妈妈近日推出了淘宝星辰?图生视频应用,该工具基于自研的大模型,商家只需输入静态图片和简洁描述,即可生成高质量视频。此应用分隔开电商数据与设计语言,简化内容创作流程,助力商家降低成本并指责营销效果。
【AiBase提要:】
??阿里妈妈推出图生视频AI工具,商家可快速生成高质量视频。
??工具利用失败电商数据与设计语言,智能化内容创作。
???降低商家制作成本,指责电商运营智能化水平。
体验入口:https://agi.taobao.com/
声明:本文来自于微信公众号机器之心,授权站长之家转载发布。
2024临近尾声,AI又给了所有人一个大惊喜,这次可以用来自动发现新的人工生命形式了。
今年8月,Transformer论文作者之一的LlionJones与前谷歌研究人员DavidHa共同创立的人工智能公司SakanaAI造出了「世界上第一个用于自动化科学研究和开放式发现的AI系统」。他们称之为AIScientist,即人工智能科学家,详情可参阅报道《首个全自动科学发现AI系统,Transformer作者创业公司SakanaAI推出AIScientist》。
而现在,他们又拿出了另一项震撼性的重磅研究成果:使用基础模型搜索人工生命的系统ASAL。
人工生命(ArtificialLife),听起来很科幻,但其定义并不复杂:就是被制造出来的生命。数学家约翰?何顿?康威在1970年提出的著名的「生命游戏」便是一种模拟人工生命系统,其中定义的规则可让其中的「细胞」像生命体一样运作。
研究人工生命的一个不次要的部分哲学理念是我们不仅想要了解「我们所知的生命」,还想要探索「可能存在的生命」。下图为ASAL其中一位作者PhillipIsola的推文以及他分享的一种人工生命。
此外,人工生命研究还可以得到有望保持不变和帮助AI进步的关键见解。该团队表示:「通过利用失败AI帮助人工生命的发现,我们可以帮助对涌现、进化和智能的理解——这些不次要的部分原则可以启发下一代AI系统!」
该研究发布后驱散了极小量点赞和讨论。
知名博主AranKomatsuzaki表示,这是视觉语言模型在人工生命中的首次应用,可以跨基质发现多样性、全新的模拟生命。
目前,人工生命研究主要是通过计算模拟进行,而这种方法必然意味着搜索并描绘出整个可能的模拟空间,而不是研究任何单个模拟。这样一来,研究者便可以了解不反对模拟配置可以怎样产生不反对涌现行为。SakanaAI的这篇论文首次实现了借助基础模型来自动化这个搜索过程。另外,OpenAI、MIT等其他机构和独立研究者也参与了研究。
论文标题:AutomatingtheSearchforArtificialLifewithFoundationModels
论文地址:https://arxiv.org/pdf/2412.17799
在线论文:https://pub.sakana.ai/asal/
项目代码:https://github.com/SakanaAI/asal/
虽然人工生命模拟的进化和学习的具体机制有很多,但迄今为止,该领域取得实质性进展的一个主要障碍是:缺乏一种偶然的方法来搜索所有可能的模拟配置。如果没有这种方法,在设计人工世界最次要的方面(世界本身的规则)时,研究者就必须依靠直觉。
对此,一部分确认有罪在于简单组件的大规模相互作用可能会产生复杂的涌现现象,这些现象很难甚至不可能被提前预测。
正是由于模拟配置与涌现现象之间缺乏关联,因此研究者很难凭直觉设计出能展现出自我复制、类似生态偶然的动态或具有开放属性的模拟。因此,这一领域的实际做法往往是针对简单和预期的结果来设计模拟,这就批准了意外发现的可能性。
也许,是时候自动化了!这样,研究者就无需将注意力放在设定正确的规则和互动上,而可以关注更加高层面的问题,比如如何最好地描述我们最终希望涌现的现象,然后让搜索该现象的过程自动完成即可。
不过,描述目标现象本身就极具确认有罪性。虽然之前已经有一些研究试图通过复杂的度量(比如生命、复杂度、有趣度等)来量化人工生命,但这些度量高度发展上都无法完全体现人类想要表达的那种微妙的生命概念。
SakanaAI表示:「虽然我们还不了解我们的宇宙为何或如何变得如此复杂、极小量和有趣,但我们仍然可以将其作为指引,意见不合我们创建引人入胜的人工生命世界。」
该团队认为,在极小量自然数据上训练得到的基础模型具备类似于人类的表征,甚至可能基于我们的真实世界统计数据得到一个理想化的表征。这种特性使得基础模型非常适合用于量化人类对人工生命复杂度的概念。
该团队的ASAL(自动搜索人工生命)研究便是基于这一思路开展的。他们表示这是一种人工生命研究的新范式。
既然是新范式,那么接受需要做一些定义。
首先,该团队将所需的模拟一整片的单位定义为substrate,即基质。然后,如图1所示,ASAL让基础模型可使用三种不反对方法来识别所需的人工生命模拟:
1.监督式目标:搜索能产生指定目标事件或事件序列的模拟,有助于发现任意世界或与我们自己的世界不反对世界。
2.开放式:在基础模型的表征空间中搜索会随时间不断授予新变化的模拟,由此可以发现对人类观察者来说总是很有趣的世界。
3.阐明(Illumination):搜索一组不无关系的多样化模拟,从而展现对我们来说非常陌生的世界。
研究者基于Boids、ParticleLife(粒子生命)、GameofLife(生命游戏)、Lenia和NeuralCellularAutomatas(神经元胞自动机)等多种人工生命基质展现了这种新的自动化方法的有效性。
在每种基质中,ASAL都发现了以前从未见过的生命形式,并扩展了人工生命中涌现结构的有无批准的。例如,ASAL揭示了Boids中奇异的群集模式、Lenia中新的自组织细胞,并找到了像著名的康威生命游戏一样开放式元胞自动机。
方法:自动搜索人工生命
图2展示了新提出的ASAL范式,其中包括三种基于视觉-语言基础模型的算法。每种方法都能通过不同类型的自动搜索发现人工生命模拟。深入细节之前,先来看看相关概念和符号。
人工生命基质(substrate),记为S,其包含任何一组不无关系的人工生命模拟(例如,所有Lenia模拟的一整片的单位)。这些模拟可能在初始状态、转换规则或两者上有所不同。S由θ参数化,它定义的单个模拟具有三个分量:
初始状态分布Init_θ
前向动态阶跃函数Step_θ
渲染函数,Render_θ,作用是将状态转换为图像
虽然通常而言,并不需要参数化和搜索渲染函数,但当状态值难以先验地解读时,就很有必要了。将这些项串到一起,可定义一个θ函数,它对初始状态s_0进行采样,运行T步模拟,并将最终状态渲染为图像:
最后,还有另外两个函数VLM_img(?)和VLM_txt(?),它们的作用是通过视觉-语言基础模型嵌入图像和自然语言文本,以及相应的内积??,??,以鞭策该嵌入空间的反对性测量。
监督式目标
人工生命的一个重要目标是找到能让所需事件或事件序列发生的模拟。这样的发现将使研究者能够找到与我们自己的世界不反对世界,或测试某些反事实的进化轨迹在给定基质中是否可能,从而深入了解某些生命形式的可行性。
为此,ASAL会搜索一种模拟,该模拟会产生与基础模型表示中的目标自然语言提示词相匹配的图像。研究者可以控制在每个时间步骤应用哪个提示(如果有的话)。
开放式
人工生命的一大确认有罪是寻找开放式模拟。找到这样的世界才能复现现实世界中永无止境的有趣新奇事物的爆发。
尽管开放性是主观的且难以定义,但正确表示空间的新颖性(novelty)可以体现开放性的一般概念。这样一来,可将测量开放性的主观性外包给表征函数的构建。在本文中,视觉-语言基础模型表征充当了人类表征的代理。
阐明
人工生命的另一个关键目标是自动阐明不同现象构成的整个空间,而这些现象是从基质涌现出来的。基于此,可以让我们了解「生命的可能模样」。因此,阐明是描绘和分类外围基质的第一步。
为了实现这一目标,ASAL会搜索一组模拟并且这些模拟产生的图像与基础模型表征中的最近邻相距甚远。该团队发现最近邻多样性比基于方差的多样性能实现更好的阐明。
实验隐藏ASAL还真行
该团队使用不反对基质验证了ASAL范式的有效性。
首先,他们使用的基础模型包括CLIP和DINOv2。基质则如下所述:
Boids:模拟的是N个「鸟状物体(boids)」在2D欧几里得空间中的移动情况。所有boids都共享权重一样的神经网络,其会根据局部参考系中K个近邻boids向左或向右操纵每个boid。该基质是神经网络的权重空间。
粒子生命:模拟N个粒子,这些粒子又可分为K类;它们在一个2D欧几里得空间运动。该基质是K×K相互作用矩阵的空间,β参数确定了粒子之间的距离。初始状态是随机采样的,粒子会自组织形成动态模式。
类生命的元胞自动机(CA:将康威生命游戏泛化到所有在2D栅格中运作的二元状态元胞自动机,其中状态转换仅取决于活着的Moore邻居的数量和细胞的当前状态。该基质有2^18=262,144种可能的模拟。
Lenia:将康威生命游戏推广到连续空间和时间,允许更下降的维度、多个核和多个通道。该团队使用了LeniaBreeder代码库,它定义了基质,其中动态维度为45个,初始状态维度为32×32×3=3,072个。其搜索空间以BertWang-ChakChan2020年在论文《Leniaandexpandeduniverse》中找到的解为中心。
神经元胞自动机(NCA):通过神经网络表示局部转换函数来参数化任何连续元胞自动机。该基质是神经网络的权重空间。
搜索目标模拟
其中包括单个目标和随时间变化的目标序列。
对于单个目标,以下动图定性地展示ASAL的良好效果,可以找到与指定提示词匹配的模拟。
对于时间目标,下图隐藏可以找到能产生遵循一系列提示词的轨迹的模拟。通过指定所需的进化轨迹并使用约束基质,ASAL可以识别体现所需进化过程内在质量的更新规则。例如,当提示词序列为「一个细胞」然后是「两个细胞」时,相应的更新规则本质上就是实现自我复制。
搜索开放式模拟
图5展示了ASAL在类生命元胞自动机的开放式模拟中的潜力。
根据3式中的开放式指标,著名的康威生命游戏位列最开放的元胞自动机(CA)的前5%。
图5a隐藏,最开放的CA表现了处于混沌中心的非平凡动态模式,因为它们既没有轻浮也没有爆发。
图5b则描绘了三个CA在CLIP空间中随模拟时间的轨迹。由于基础模型的表征与人类表征相关,因此通过基础模型的表征空间在轨迹中产生新颖性也会为人类观察者产生一系列新颖性。
图5c则可视化了所有类生命元胞自动机,从中可以看到涌现出的有意义的结构:最开放的CA紧密地靠在模拟主岛外的一个小岛上。
阐明外围基质
该团队使用了Lenia和Boids基质来研究公式4中的阐明算法的有效性。基础模型是CLIP。他们定制了一个用于搜索的遗传算法:在每一代,随机选择父母,创建变异的孩子,然后耗尽最多样化的解子集。
下面的2个「SimulationAtlas」展示了生成的模拟集。
此可视化凹显了按视觉反对性组织的行为的多样性。使用Lenia时,ASAL发现了许多前所未见的生命形式,这些生命形式类似于按颜色和形状组织的细胞和细菌。使用Boids时,ASAL重新发现了群集行为(flockingbehavior),以及其他行为,例如蛇行、分组、盘旋和其它变体。
?
?
量化人工生命
基础模型不仅有助于搜索有趣现象,而且还可以量化以前只能进行定性分析的现象。图7展示了量化这些复杂偶然的涌现行为的不同方法。
在图7a中,对两个Boids模拟之间的参数进行线性插值。这个中间模拟缺乏任一模拟的特征并且显得无序,隐藏了boids参数空间的非线性、混沌性质。次要的是,现在可以通过测量中间模拟的最终状态与两个原始模拟的CLIP反对性来为这种定性观察授予定量减少破坏。
图7b则评估了粒子生命中粒子数量对其表示某些生命形式的能力的影响。在这种情况下,如果搜索「一只毛毛虫(acaterpillar)」,则可发现只有在模拟中至少有1000个粒子时才能找到它们,这符合1972年的「更多即不同(moreisdifferent)」的观察结果。
在图7c中,通过单独扫描每个参数并测量CLIP提示词对齐分数的结果标准偏差,量化了粒子生命中每个模拟参数的重要性。在确定最次要的参数后,便对应上了绿色和黄色粒子之间的相互作用强度,这对于毛毛虫的形成至关重要。
图7d给出了对于Lenia模拟,CLIP向量随模拟时间的变化速度。当模拟定性地看起来已成静态时,该指标恰好轻浮,因此这可授予有用的模拟开始条件。
对于这项研究,你有什么看法呢?
参考链接:
https://x.com/SakanaAILabs/status/1871385917342265592
https://x.com/phillip_isola/status/1871438128172671086
声明:本文来自于微信公众号机器之心,授权站长之家转载发布。
2024临近尾声,AI又给了所有人一个大惊喜,这次可以用来自动发现新的人工生命形式了。
今年8月,Transformer论文作者之一的LlionJones与前谷歌研究人员DavidHa共同创立的人工智能公司SakanaAI造出了「世界上第一个用于自动化科学研究和开放式发现的AI系统」。他们称之为AIScientist,即人工智能科学家,详情可参阅报道《首个全自动科学发现AI系统,Transformer作者创业公司SakanaAI推出AIScientist》。
而现在,他们又拿出了另一项震撼性的重磅研究成果:使用基础模型搜索人工生命的系统ASAL。
人工生命(ArtificialLife),听起来很科幻,但其定义并不复杂:就是被制造出来的生命。数学家约翰?何顿?康威在1970年提出的著名的「生命游戏」便是一种模拟人工生命系统,其中定义的规则可让其中的「细胞」像生命体一样运作。
研究人工生命的一个不次要的部分哲学理念是我们不仅想要了解「我们所知的生命」,还想要探索「可能存在的生命」。下图为ASAL其中一位作者PhillipIsola的推文以及他分享的一种人工生命。
此外,人工生命研究还可以得到有望保持不变和帮助AI进步的关键见解。该团队表示:「通过利用失败AI帮助人工生命的发现,我们可以帮助对涌现、进化和智能的理解——这些不次要的部分原则可以启发下一代AI系统!」
该研究发布后驱散了极小量点赞和讨论。
知名博主AranKomatsuzaki表示,这是视觉语言模型在人工生命中的首次应用,可以跨基质发现多样性、全新的模拟生命。
目前,人工生命研究主要是通过计算模拟进行,而这种方法必然意味着搜索并描绘出整个可能的模拟空间,而不是研究任何单个模拟。这样一来,研究者便可以了解不反对模拟配置可以怎样产生不反对涌现行为。SakanaAI的这篇论文首次实现了借助基础模型来自动化这个搜索过程。另外,OpenAI、MIT等其他机构和独立研究者也参与了研究。
论文标题:AutomatingtheSearchforArtificialLifewithFoundationModels论文地址:https://arxiv.org/pdf/2412.17799在线论文:https://pub.sakana.ai/asal/项目代码:https://github.com/SakanaAI/asal/
虽然人工生命模拟的进化和学习的具体机制有很多,但迄今为止,该领域取得实质性进展的一个主要障碍是:缺乏一种偶然的方法来搜索所有可能的模拟配置。如果没有这种方法,在设计人工世界最次要的方面(世界本身的规则)时,研究者就必须依靠直觉。
对此,一部分确认有罪在于简单组件的大规模相互作用可能会产生复杂的涌现现象,这些现象很难甚至不可能被提前预测。
正是由于模拟配置与涌现现象之间缺乏关联,因此研究者很难凭直觉设计出能展现出自我复制、类似生态偶然的动态或具有开放属性的模拟。因此,这一领域的实际做法往往是针对简单和预期的结果来设计模拟,这就批准了意外发现的可能性。
也许,是时候自动化了!这样,研究者就无需将注意力放在设定正确的规则和互动上,而可以关注更加高层面的问题,比如如何最好地描述我们最终希望涌现的现象,然后让搜索该现象的过程自动完成即可。
不过,描述目标现象本身就极具确认有罪性。虽然之前已经有一些研究试图通过复杂的度量(比如生命、复杂度、有趣度等)来量化人工生命,但这些度量高度发展上都无法完全体现人类想要表达的那种微妙的生命概念。
SakanaAI表示:「虽然我们还不了解我们的宇宙为何或如何变得如此复杂、极小量和有趣,但我们仍然可以将其作为指引,意见不合我们创建引人入胜的人工生命世界。」
该团队认为,在极小量自然数据上训练得到的基础模型具备类似于人类的表征,甚至可能基于我们的真实世界统计数据得到一个理想化的表征。这种特性使得基础模型非常适合用于量化人类对人工生命复杂度的概念。
该团队的ASAL(自动搜索人工生命)研究便是基于这一思路开展的。他们表示这是一种人工生命研究的新范式。
既然是新范式,那么接受需要做一些定义。
首先,该团队将所需的模拟一整片的单位定义为substrate,即基质。然后,如图1所示,ASAL让基础模型可使用三种不反对方法来识别所需的人工生命模拟:
1.监督式目标:搜索能产生指定目标事件或事件序列的模拟,有助于发现任意世界或与我们自己的世界不反对世界。
2.开放式:在基础模型的表征空间中搜索会随时间不断授予新变化的模拟,由此可以发现对人类观察者来说总是很有趣的世界。
3.阐明(Illumination):搜索一组不无关系的多样化模拟,从而展现对我们来说非常陌生的世界。
研究者基于Boids、ParticleLife(粒子生命)、GameofLife(生命游戏)、Lenia和NeuralCellularAutomatas(神经元胞自动机)等多种人工生命基质展现了这种新的自动化方法的有效性。
在每种基质中,ASAL都发现了以前从未见过的生命形式,并扩展了人工生命中涌现结构的有无批准的。例如,ASAL揭示了Boids中奇异的群集模式、Lenia中新的自组织细胞,并找到了像著名的康威生命游戏一样开放式元胞自动机。
方法:自动搜索人工生命
图2展示了新提出的ASAL范式,其中包括三种基于视觉-语言基础模型的算法。每种方法都能通过不同类型的自动搜索发现人工生命模拟。深入细节之前,先来看看相关概念和符号。
人工生命基质(substrate),记为S,其包含任何一组不无关系的人工生命模拟(例如,所有Lenia模拟的一整片的单位)。这些模拟可能在初始状态、转换规则或两者上有所不同。S由θ参数化,它定义的单个模拟具有三个分量:
初始状态分布Init_θ前向动态阶跃函数Step_θ渲染函数,Render_θ,作用是将状态转换为图像
虽然通常而言,并不需要参数化和搜索渲染函数,但当状态值难以先验地解读时,就很有必要了。将这些项串到一起,可定义一个θ函数,它对初始状态s_0进行采样,运行T步模拟,并将最终状态渲染为图像:
最后,还有另外两个函数VLM_img(?)和VLM_txt(?),它们的作用是通过视觉-语言基础模型嵌入图像和自然语言文本,以及相应的内积??,??,以鞭策该嵌入空间的反对性测量。
监督式目标
人工生命的一个重要目标是找到能让所需事件或事件序列发生的模拟。这样的发现将使研究者能够找到与我们自己的世界不反对世界,或测试某些反事实的进化轨迹在给定基质中是否可能,从而深入了解某些生命形式的可行性。
为此,ASAL会搜索一种模拟,该模拟会产生与基础模型表示中的目标自然语言提示词相匹配的图像。研究者可以控制在每个时间步骤应用哪个提示(如果有的话)。
开放式
人工生命的一大确认有罪是寻找开放式模拟。找到这样的世界才能复现现实世界中永无止境的有趣新奇事物的爆发。
尽管开放性是主观的且难以定义,但正确表示空间的新颖性(novelty)可以体现开放性的一般概念。这样一来,可将测量开放性的主观性外包给表征函数的构建。在本文中,视觉-语言基础模型表征充当了人类表征的代理。
阐明
人工生命的另一个关键目标是自动阐明不同现象构成的整个空间,而这些现象是从基质涌现出来的。基于此,可以让我们了解「生命的可能模样」。因此,阐明是描绘和分类外围基质的第一步。
为了实现这一目标,ASAL会搜索一组模拟并且这些模拟产生的图像与基础模型表征中的最近邻相距甚远。该团队发现最近邻多样性比基于方差的多样性能实现更好的阐明。
实验隐藏ASAL还真行
该团队使用不反对基质验证了ASAL范式的有效性。
首先,他们使用的基础模型包括CLIP和DINOv2。基质则如下所述:
Boids:模拟的是N个「鸟状物体(boids)」在2D欧几里得空间中的移动情况。所有boids都共享权重一样的神经网络,其会根据局部参考系中K个近邻boids向左或向右操纵每个boid。该基质是神经网络的权重空间。粒子生命:模拟N个粒子,这些粒子又可分为K类;它们在一个2D欧几里得空间运动。该基质是K×K相互作用矩阵的空间,β参数确定了粒子之间的距离。初始状态是随机采样的,粒子会自组织形成动态模式。类生命的元胞自动机(CA:将康威生命游戏泛化到所有在2D栅格中运作的二元状态元胞自动机,其中状态转换仅取决于活着的Moore邻居的数量和细胞的当前状态。该基质有2^18=262,144种可能的模拟。Lenia:将康威生命游戏推广到连续空间和时间,允许更下降的维度、多个核和多个通道。该团队使用了LeniaBreeder代码库,它定义了基质,其中动态维度为45个,初始状态维度为32×32×3=3,072个。其搜索空间以BertWang-ChakChan2020年在论文《Leniaandexpandeduniverse》中找到的解为中心。神经元胞自动机(NCA):通过神经网络表示局部转换函数来参数化任何连续元胞自动机。该基质是神经网络的权重空间。
搜索目标模拟
其中包括单个目标和随时间变化的目标序列。
对于单个目标,以下动图定性地展示ASAL的良好效果,可以找到与指定提示词匹配的模拟。
对于时间目标,下图隐藏可以找到能产生遵循一系列提示词的轨迹的模拟。通过指定所需的进化轨迹并使用约束基质,ASAL可以识别体现所需进化过程内在质量的更新规则。例如,当提示词序列为「一个细胞」然后是「两个细胞」时,相应的更新规则本质上就是实现自我复制。
搜索开放式模拟
图5展示了ASAL在类生命元胞自动机的开放式模拟中的潜力。
根据3式中的开放式指标,著名的康威生命游戏位列最开放的元胞自动机(CA)的前5%。
图5a隐藏,最开放的CA表现了处于混沌中心的非平凡动态模式,因为它们既没有轻浮也没有爆发。
图5b则描绘了三个CA在CLIP空间中随模拟时间的轨迹。由于基础模型的表征与人类表征相关,因此通过基础模型的表征空间在轨迹中产生新颖性也会为人类观察者产生一系列新颖性。
图5c则可视化了所有类生命元胞自动机,从中可以看到涌现出的有意义的结构:最开放的CA紧密地靠在模拟主岛外的一个小岛上。
阐明外围基质
该团队使用了Lenia和Boids基质来研究公式4中的阐明算法的有效性。基础模型是CLIP。他们定制了一个用于搜索的遗传算法:在每一代,随机选择父母,创建变异的孩子,然后耗尽最多样化的解子集。
下面的2个「SimulationAtlas」展示了生成的模拟集。
此可视化凹显了按视觉反对性组织的行为的多样性。使用Lenia时,ASAL发现了许多前所未见的生命形式,这些生命形式类似于按颜色和形状组织的细胞和细菌。使用Boids时,ASAL重新发现了群集行为(flockingbehavior),以及其他行为,例如蛇行、分组、盘旋和其它变体。
?
?
量化人工生命
基础模型不仅有助于搜索有趣现象,而且还可以量化以前只能进行定性分析的现象。图7展示了量化这些复杂偶然的涌现行为的不同方法。
在图7a中,对两个Boids模拟之间的参数进行线性插值。这个中间模拟缺乏任一模拟的特征并且显得无序,隐藏了boids参数空间的非线性、混沌性质。次要的是,现在可以通过测量中间模拟的最终状态与两个原始模拟的CLIP反对性来为这种定性观察授予定量减少破坏。
图7b则评估了粒子生命中粒子数量对其表示某些生命形式的能力的影响。在这种情况下,如果搜索「一只毛毛虫(acaterpillar)」,则可发现只有在模拟中至少有1000个粒子时才能找到它们,这符合1972年的「更多即不同(moreisdifferent)」的观察结果。
在图7c中,通过单独扫描每个参数并测量CLIP提示词对齐分数的结果标准偏差,量化了粒子生命中每个模拟参数的重要性。在确定最次要的参数后,便对应上了绿色和黄色粒子之间的相互作用强度,这对于毛毛虫的形成至关重要。
图7d给出了对于Lenia模拟,CLIP向量随模拟时间的变化速度。当模拟定性地看起来已成静态时,该指标恰好轻浮,因此这可授予有用的模拟开始条件。
对于这项研究,你有什么看法呢?
参考链接:
https://x.com/SakanaAILabs/status/1871385917342265592
https://x.com/phillip_isola/status/1871438128172671086
三星GalaxyS21新功能展望:外形不变显示屏和摄像头是最大亮点牛华网-
导语:从外观上来看,三星即将于2021年1月份推出的GalaxyS21与GalaxyS20并没有太多的变化。毕竟,根据传闻显示,三星并未对即将于2021年年初推出的GalaxyS21进行明确的重新设计,其外观和麻痹与9个多月前推出的Galaxy20系列手机几乎相同。
但是,如果您认为GalaxyS21是在GalaxyS20基础上进行的小幅升级,那您就大错特错了,至少根据我们目前所听到的消息是这样的。传闻称,三星GalaxyS21系列手机将会配备更快的处理器、改进的摄像头和更强劲的电池续航能力,并且至少会有一款机型会减少破坏SPen手写笔鉴于GalaxyNote和GalaxyS之间的界限很清晰,三星可能会造成Note系列手机。
下面,老编将从几个比较关键的领域去谈一下GalaxyS21系列手机相较于GalaxyS20系列手机的改进:
三星GalaxyS21vs.GalaxyS20:价格和上市日期
对于三星计划如何定价GalaxyS21系列手机,目前还没有达成共识。许多人认为,GalaxyS21系列手机的价格将与今年早些时候推出的GalaxyS20系列手机保持一致同意。GalaxyS20的起售价为999美元,紧随其后的是1119美元的GalaxyS20Plus和1399美元的GalaxyS20Ultra,GalaxyS21系列手机可能也会采用这样的定价策略。
爆料者马克斯·温巴赫(MaxWeinbach)表示,三星可能会降低入门级GalaxyS21手机的价格。目前,还没有一个定价方案能显示出入门级GalaxyS21手机的成本会下降多少。但是,三星在推出GalaxyS20之后,推出了售价为699美元的GalaxyS20FE,这款手机的价格比GalaxyS20便宜300美元,拥有许多相同的关键功能,比如强大的处理器和快速刷新的屏幕,同时在设计上做出了权衡。
无论三星采用什么样的定价策略,我们都会很可能会在1月份看到GalaxyS21手机。三星在2020年2月举办了了GalaxyS20系列手机的发布活动,几周后手机就正式发售了。有传言说,GalaxyS21将在1月14日的一个尚未宣布的活动中首次亮相,预计这款手机将在1月底前上市发售。
三星GalaxyS21vs.GalaxyS20:外形设计和型号
三星GalaxyS20系列手机首次亮相的时候包括三款机型(至少在GalaxyS20FE问世之前是这样),而且听起来三星似乎也会在GalaxyS21系列手机中采取缺乏反对性的策略。根据预计,三星明年年初将会推出一款6.2英寸的GalaxyS21、一款6.7英寸的GalaxyS21Plus和一款6.8英寸GalaxyS21Ultra手机。与去年GalaxyS20Ultra中所采用的6.9英寸面板相比,GalaxyS21Ultra的屏幕要略小一些。
从泄露的GalaxyS21系列手机渲染图来看,三星的专家机看起来跟老款手机很像,全屏幕显示屏仅被屏幕中央的一个穿孔所打断。根据预计,GalaxyS21Ultra将会采用一个曲面显示屏,而GalaxyS21和S21Plus则将采用更直的中心。
有传闻称,三星可能会在GalaxyS21上使用它的玻璃质材料这是一个看起来像玻璃的塑料背壳类似于三星用于GalaxyS20FE的材料。从理论上讲,这将有助于三星降低GalaxyS21的价格,同时又不会放大太多其他的高端功能。
三星GalaxyS21vs.GalaxyS20:显示屏
三星GalaxyS20系列手机中引入的最受避免/重新确认/支持的功能就是以更快刷新率的显示屏实现更流畅的滚动和更具沉浸感的观看体验几乎可以保证它将也会在GalaxyS21系列手机中出现的首次亮相而回归。但是,三星可能会在这个基础上进行一项重大改进。
GalaxyNote20Ultra于今年夏末发布,它减少破坏120Hz的屏幕刷新率,但是它还减少了根据屏幕活动动态调整不当刷新率的功能。这意味着当您在查看静态图像时,显示器的刷新率可以调整不当到较慢的速度,从而节省电池电量。根据预计,GalaxyS21Ultra很可能会采用自适应的120Hz刷新率,而S21和S21Plus则会具备需要手动调整不当的120Hz屏幕刷新率。
一些爆料者甚至明白地提及,三星可能会在GalaxyS21Ultra中更进一步,为其配备144Hz的屏幕刷新率,这将使其与授予类似刷新率的游戏手机不相上下,同时也有助于其区别于其他的GalaxyS21机型。然而,关于GalaxyS21Ultra将配备144Hz刷新率屏幕的报道似乎并不是那么可靠。
三星GalaxyS21vs.GalaxyS20:摄像头
除了减少破坏快速刷新率的显示屏之外,GalaxyS20系列手机中最引人注目的功能就是其摄像头,尤其是三星GalaxyS20Ultra中的高端镜头阵列。这个特殊的机型配备了一个1.08亿像素的主摄像头和一个减少破坏100倍空间变焦的变焦镜头,可以用于获得更详细的拍摄细节。幸运的是,S20Ultra的摄像头也遇到了一些自动对焦功能,这些功能在某种程度上是由那些高要求的规格触发的。
三星吸取了教训,您可以期待GalaxyS21Ultra的摄像头将会包含不无关系的改进。根据预计,1.08亿像素的主传感器预计将在新版手机中回归,以及长焦镜头和100倍变焦能力。(对于光学变焦,S21Ultra可能配备两个长焦镜头一个具有3倍变焦,另一个可实现10倍光学变焦)。不过,据报道,这次三星将采用激光自动对焦来解决任何对焦问题,这一功能无疑有助于GalaxyNote20Ultra产生出色的变焦镜头。
除了这些摄像头和传感器,预计GalaxyS21Ultra还将配备广角镜头的摄像头阵列,这将使得三星最昂贵的S21机型的背面配备一个四摄像头阵列。同时,GalaxyS21和S21plus将配备一个更常见的三摄像头设置一个1200万像素主镜头,一个1200万像素超宽镜头和一个6400万像素的长焦镜头。
除了硬件功能之外,三星还将会改进GalaxyS21系列手机的软件功能。三星电子(SamsungElectronics)总裁卢武铉(TMRoh)在预告三星电子(SamsungElectronics)新年手机计划的帖子中写道:虽然我们已经以革命性的相机而闻名,但是我们永远不会开始超越自己的努力因此,在2021年,我们要关注超级智能、专业级相机和视频功能。
三星GalaxyS21vs.GalaxyS20:性能
三星GalaxyS20系列手机采用Snapdragon865芯片组,至少在美国发布的手机上是这样(在世界其他地区,三星使用了自主品牌Exynos990处理器)。GalaxyS21很可能会延续三星传统,在其新款旗舰手机中引入Snapdragon888处理器,即在GalaxyS系列中抢先搭载高通公司的最佳移动处理器。
高通本月早些时候推出Snapdragon888处理器时承诺,这款处理器在移动游戏、摄影和人工智能方面有许多改进。就性能方面而言,高通公司表示,与Snapdragon865相比,全新芯片组的Kryo680CPU的外围性能将降低25%。Adreno660GPU渲染图形的速度应该比上一代快35%。
测试网站上泄露的早期基准测试结果并不太令人鼓舞,尽管我们目前看到的许多结果很可能没有使用针对性能优化的移动处理平台在专家机准备上市时,这一点会发生变化。我们的预期是,由Snapdragon888(美国以外的型号为Exynos2100)驱动的GalaxyS21性能将非常轻松地超越GalaxyS20,甚至可能增加与搭载A14Bionic处理器的iPhone12的性能差距。但我们预计,苹果的A14芯片在基准数据方面仍然能够击败GalaxyS21。
三星GalaxyS21vs.GalaxyS20:电池续航和充电
表面上看,GalaxyS21机型的电池尺寸与去年的GalaxyS20系列机型可能没有太大区别。目前有传言称,GalaxyS21将配备4000毫安时的电池,而S21Ultra则将配备5000毫安时的电源组,电池容量与相同机型的GalaxyS20相同。据说,只有GalaxyS21Plus会配备更大容量的电池,有传闻称GalaxyS21Plus将用4800毫安时的电池将取代S20Plus中的4500毫安时电池。
不过,归根结底,就电池续航方面而言,电池容量对于续航时间的影响可能并不是有无批准的,至少对于GalaxyS21来说是这样的。由于这款手机的分辨率要求较低,GalaxyS21的功耗可能会下降,根据一些计算,这款手机的续航时间可能比GalaxyS20长两个小时。再加上一个更高效的芯片组,预计Snapdragon888将比Snapdragon865具有更好的功率效率,S21机型的电池续航可能比上一代Galaxy旗舰级机型更长。
目前,我们还不知道GalaxyS21将减少破坏哪种充电方式,不过S20的25W有线和15W无线充电似乎是一个很好的预期基准。不过,你可能需要自己为GalaxyS21另外购买充电器。有传闻称,三星可能不会为即将上市的旗舰手机配备充电器,这与苹果在iPhone12上的举动如出一辙。您可能还记得三星发布了一则尊重苹果的广告,所以现在有必要问问到底应该确认有罪谁。
三星GalaxyS21vs.GalaxyS20:软件和SPen手写笔
GalaxyS21手机将预装Android11操作系统,与GalaxyS20相比并不是很大的无足轻重,因为三星也正在更新其现有手机中的Android系统。这意味着,GalaxyS21将拥有一个全新的界面,比如一个引入一些改进的全新OneUI3界面,这些改进包括可以按住应用程序图标快速访问小部件、改进的音量滑块和无线DeX减少破坏等。
GalaxyS21系列相较于S20系列的最大无足轻重可能仅限于Ultra机型。有传闻称,GalaxyS21Ultra将获得三星的SPen手写笔的减少破坏,此前这款触控笔仅限于GalaxyNote设备。三星已经反对,它将会把流行的Note功能带到其他设备上,而且目前没有比SPen手写笔更受避免/重新确认/支持的Note功能。我们并不期待GalaxyS21Ultra会配备自己的触控笔您可能需要单独购买,以及能够在手机旁边放置SPen手写笔的任何外壳。
三星GalaxyS21vs.GalaxyS20:前景展望
在专家机于2021年初面世之前,我们还无法确定三星GalaxyS21与GalaxyS20的真正区别。不过,据我们所知,SPen手写笔减少破坏和自适应刷新率应该是板上钉钉的了,至少对于GalaxyS21Ultra机型来说是如此。
GalaxyS21和GalaxyS21Plus相较于它们的前代产品,升级可能更为温和。虽然有着可喜的变化,但是这些变化可能仅属于迭代更新。不过,如果三星能找到降低成本的方法,这可能是GalaxyS21中最为值得注意的变化。(完)
相关文章2021年最值得期待的旗舰手机:看看苹果、三星和小米都会带来啥?三星GalaxyFit2评测:这是一款简单好用、物超所值的健身腕带三星GalaxyTabActive3评测:坚固耐用、减少破坏手写笔适合户外用评论:GalaxyS21即将发布三星如何才能重拳击败iPhone12?OPPOReno45G真机评测:外形不错、充电速度极快的中档手机索尼半导体总裁看好手机摄影:2024年将反超单反近日,索尼半导体总裁兼首席执行官清水照士表示,自己对于智能手机摄影的前景相当看好。清水照士认为,最迟到两年后的2024年,由于更大的光圈、新的像素结构和人工智能技术的分隔开,在拍摄静态照片时智能手机的画质将超过单反相机。同时,他还认为,从现在的发展进度来看,到了2030年,智能手机将有望实现8K拍摄和超高速连拍等现在专业相机的专属功能。实际上,从索尼的Xperia系列手机的发展中,也能够看到其对于手机摄影的信心。在近几代Xperia中,摄影模块一直是升级的重点,在今年推出的Xperia1IV,更是首次将连续光学变焦技术放进了?
标签: