AI研习社
-
图机器学习入门:基本概念介绍
图机器学习(Graph Machine Learning,简称Graph ML)是机器学习的一个分支,专注于利用图形结构的数据。在图形结构中,数据以图的形式表示,其中的节点(或顶点)表示实体,边(或链接)表示实体之间的关…
-
一文了解自动驾驶轨迹预测技术
01 引言 人在驾驶车辆时会时刻考虑周围的车辆或行人,持续不断地评估相邻车辆及行人的移动路径,以此指导自身操作。这一连串预判,往往在熟练驾驶者心中成为一种近乎本能的反应,尤其是一位经验老到的司机,能凭借深厚的驾驶经验和敏…
-
AffineQuant: 大语言模型的仿射变换量化
AffineQuant: Affine Transformation Quantization for Large Language Models 1. 论文信息 2. 引言 本文研究了大型语言模型(LLMs)在移动和边…
-
创客项目秀 | 基于 XIAO ESP32S3 Sense的在线语音助手
寒假在家练活动项目新鲜出炉,今天给大家带来的是参赛选手刘鹏的ESP32S3 Sense接入语音识别+MiniMax模型对话方案,该项目将嵌入式技术与AI模型相结合,打造个人专属的生活小助手。 项目制作流程 围绕ESP32…
-
金融大模型,要听见远方的风
金融大模型,被认为AI大模型产业化落地的第一站。 金融行业有着结构化数据充沛、应用场景丰富、数字化基础设施良好等一系列特点,这些都是融合AI技术的利好因素。所以当AI大模型开始爆火之后,各界会不约而同认为金融是AI大模型…
-
新华三AI for ALL:释放AI落地乘法效应
在当今快速发展的科技时代,AI正成为推动各行各业进步的关键力量。新华三集团,作为AI技术的先行者,致力于将AI技术全面融入其产品和服务中,以实现从“AI in ALL”到“AI for ALL”的转变。通过其创新的1+N…
-
使用PyTorch实现L1, L2和Elastic Net正则化
在机器学习中,L1正则化、L2正则化和Elastic Net正则化是用来避免过拟合的技术,它们通过在损失函数中添加一个惩罚项来实现。 正则化介绍 L1 正则化(Lasso回归): L1 正则化通过向损失函数添加参数的绝对…
-
媲美Sora!可生成16s 1080视频!清华联合生数提出视频生成新模型Vidu!
今日论文推荐 论文名:Vidu: a Highly Consistent, Dynamic and SkilledText-to-Video Generator with Diffusion Models 论文链接:ht…
-
工业智能质检 | 2024高通边缘智能创新应用大赛赛道解读
随着全球制造业竞争日益激烈,我国制造业不断寻求转型升级,产品质量要求越来越高,传统以人工为主的质检方式在准确性、效率和成本控制方面已无法满足现代工业的需求,工业智能质检应运而生并迅速发展。 依托机器视觉技术高速度、高精度…
-
创客项目秀|本地语音聊天机器人:在reComputer 上部署 Riva 和 LIama2
随着人工智能技术的快速发展,语音交互已成为越来越重要的人机交互模式。特别是在智能家居、个人助理和客户服务支持等领域,对语音聊天机器人的需求正在显着增长。然而,现有的大多数语音聊天机器人都依赖于云计算服务,这在一定程度上引…
-
AlphaFold 3来了!闭源但可供科研使用,DeepMind 子公司近水楼台先推进商用?
当地时间 5 月 8 日,Google DeepMind 联合其子公司 Isomorphic Labs 重磅发布 AlphaFold 3。 DeepMind 表示,AlphaFold 3 以前所未有的精确度成功预测了所有…
-
赋能数字生产力“跃迁”,新一代中国企业软件加速迈向世界一流
去年以来,“新质生产力”已成为中国经济领域的一个“高频词”。在今年《政府工作报告》列出的十项政府工作中,“大力推进现代化产业体系建设,加快发展新质生产力”列于首位,其重要性不言而喻。 特别是近年来,以大模型、大数据、云计…
-
攻击者正在利用AI,对保险公司发起大规模欺诈
保险欺诈一直是保险行业面临的重要挑战之一,尤其随着技术的进步,欺诈者也在不断更新其手段,利用AI技术,包括生成式模型、机器学习和数据分析工具等欺骗保险公司,而AI技术的应用正成为他们的新工具,使其犯罪行为更加隐蔽和复杂,…
-
论文推荐:用多词元预测法提高模型效率与速度
这是4月发表的论文《Better & Faster Large Language Models via Multi-token Prediction》,作者们提出了一种创新的多词元预测方法,该方法在提高大型语言模…
-
AI加速数据中心技术发展 – 2024 OCP EMEA Regional Summit 会议资料
去年的OCP EMEA区域峰会是在布拉格举办,今年在葡萄牙首都里斯本,都是好地方。 2024 OCP EMEA Regional Summit演讲资料网盘分享 https://pan.baidu.com/s/16-xJo…
-
LLM 大模型学习必知必会系列(一):大模型基础知识篇
LLM 大模型学习必知必会系列(一):大模型基础知识篇 魔搭 ModelScope 开源的 LLM 模型 魔搭 ModelScope 欢迎各个开源的 LLM 模型在社区上做开源分享。目前社区上已经承载了来自各个机构贡献的…
-
号称能打败MLP的KAN到底行不行?数学核心原理全面解析
前几天火爆的Kolmogorov-Arnold Networks是具有开创性,目前整个人工智能社区都只关注一件事LLM。我们很少看到有挑战人工智能基本原理的论文了,但这篇论文给了我们新的方向。 mlp或多层感知位于AI架…
-
WaveNet结构与推断
WaveNet是2016年Google DeepMind 提出的一种Neural Vocoder 架构,模型主体为一个基于空洞因果卷积(Dilated Causal Convolution)的概率模型。即基于Condit…
-
复旦脑科学研究院新成果:借鉴语义分割,开发空间转录组语义注释工具 Pianno
自 2020 年被 Nature Methods 评选为年度技术以来,「空间转录组学」已成为当今生命科学领域最炙手可热的革命性技术之一。 简单来说,该技术能够获取组织空间信息和转录组数据,从时间和空间维度精准解析组织内基…
-
阿里林俊旸:大模型对很多人来说不够用,打造多模态Agent是关键 | 中国AIGC产业峰会
在过去一年中,通义千问系列模型持续开源。 不仅频繁放出多种版本,涉及不同的规模和模态,成绩在大模型竞技场中也名列前茅。 比如目前最大的72B模型,表现就胜过了Llama 2-70B和MoE开源模型Mixtral。 而纵观…