大模型日报 2024-06-28

大模型日报

2024-06-28

大模型资讯

1.寒武纪1号诞生:谢赛宁Yann LeCun团队发布最强开源多模态LLM
谢赛宁 Yann LeCun 团队发布了寒武纪1号,这是一个开源的多模态LLM模型。该模型以视觉为中心,探索了多种不同的视觉编码器及其组合,并设计了一种动态且可感知空间的新型连接器,将视觉特征与LLM整合在一起。团队还开发了一个以视觉为中心的基准评测工具CV-Bench。该模型在多个基准上表现出色,尤其擅长以视觉为中心的任务。

🔗:https://www.jiqizhixin.com/articles/2024-06-28-5

  1. 炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
    科大讯飞的星火4.0在语音识别和个性化AI助手方面取得了突破。语音识别在强干扰场景下的准确率达到了91%,并且支持74种语言的自由交流。个性化AI助手基于用户画像和个人资料进行增强学习,提供个性化的表达和内容。此外,科大讯飞还在医疗和教育领域应用中取得了进展,提供医疗问答、学生学习辅导等功能。讯飞星火APP已经成为人们日常生活中使用的工具之一,具备写作、编程、工作、学习等多种实用功能。

🔗:http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247736139&idx=2&sn=cbdba96b6db088f5d670be14221c1c6d&chksm=e9e9a6d640489c7bab01363c6d666a6589725c088d350cf5e80cdf5c0b4ea3e446cea54765b2&scene=0#rd

  1. 字节大模型团队Depth Anything V2模型入选苹果最新CoreML模型
    苹果公司在HuggingFace上发布了20个新的Core ML模型和4个数据集,其中字节大模型团队的单目深度估计模型 Depth Anything V2入选。该模型在细节处理上更精细,鲁棒性更强,并且速度上有显著提升。经过工程优化后,在iPhone 12 Pro Max上的推理速度达到了31.1毫秒。该模型可以应用在自动驾驶、3D建模、增强现实、安全监控以及空间计算等领域。

🔗:https://www.jiqizhixin.com/articles/2024-06-28-11

  1. 谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
    谷歌发布了Gemini家族的新成员Gemma 2,提供了90亿和270亿参数的两个版本,具有卓越的性能和高效的推理能力。Gemma 2在同等体积类别中表现出色,能够与体积超过其两倍的模型竞争。它还具有低成本、高速推理和易于部署等特点。谷歌提供了广泛的框架兼容性,使其能够轻松与主要的AI框架结合。开发者可以在Google Cloud上轻松部署和管理Gemma 2,并通过Gemma Cookbook获取实用示例和指南。谷歌还向开发者开放了Gemini 1.5 Pro的200万token上下文窗口访问权限。

🔗:https://www.jiqizhixin.com/articles/2024-06-28-15

大模型论文

  1. 符号学习助力自进化智能体
  • 摘要: 本文提出符号学习框架,使语言智能体能自主优化,模仿连接主义学习算法,实现自进化。
  1. 大规模提示探索用于评估LLM的研究
  • 摘要: 本文介绍了PrExMe,通过720多种提示模板评估开源LLM在机器翻译和摘要数据集上的表现,揭示提示策略的稳定性和变化性。
  1. CharXiv:多模态LLM图表理解评估
  • 摘要: CharXiv提供2323个复杂图表,评估多模态大语言模型在图表理解中的表现,揭示现有模型的不足。
  1. ChatGPT与教授谁更擅长解释?
  • 摘要: 研究比较了LLMs与人类在对话中解释能力,采用5-Levels数据集评估GPT4的解释效果,并通过人类评审进行验证。
  1. 语言模型对强化学习代理的心智建模研究
  • 摘要: 本文探讨大型语言模型能否通过推理建立强化学习代理的心智模型,发现其尚需进一步创新来实现全面建模。
  1. 上下文学习是否为梯度学习的一种?
  • 摘要: 研究发现大型语言模型在上下文学习中表现出逆频率效应,支持其为梯度驱动学习的一种形式。
  1. 角色扮演零样本提示的多语言对话模型
  • 摘要: 本研究探讨通过角色扮演零样本提示,利用多语言LLMs实现高效开放域对话,表现超越微调模型。
  1. 基于大语言模型的显著事件图生成
  • 摘要: 提出CALLMSAE框架,通过生成摘要识别显著事件,迭代代码优化生成事件关系图,提升生成图的准确性。
  1. 基于LLMs的企业数字化转型评估方法
  • 摘要: 本研究提出了一种基于大语言模型的创新评估方法,通过分析4407家上市公司年报,构建全面的数字化转型指标,发现数字化转型显著提升公司财务表现。
  1. IRCAN:通过识别和重加权上下文感知神经元缓解知识冲突
  • 摘要: IRCAN框架通过识别和重加权上下文感知神经元,解决LLM生成中的知识冲突问题,提升上下文处理能力。

大模型开源项目

  1. Modelscope:探索扩散模型的魔力
  • 摘要: Modelscope项目使用Python语言编写,带你体验扩散模型的神奇魅力。
  1. Claude Opus智能子代理框架
  • 摘要: Doriandarko是一个用Python编写的框架,用于智能地协调Claude Opus的子代理。
  1. CISO助手:一站式GRC管理工具
  • 摘要: CISO助手涵盖风险、应用安全和审计管理,支持46+框架,使用Python编写,适用于全球多种合规标准。
  1. Lepton AI:对话式搜索演示
  • 摘要: Lepton AI项目使用TypeScript构建快速对话式搜索演示,展示了高效的搜索功能和友好的用户交互体验。

以上就是2024-06-28的大模型日报,很高兴为你服务!

本文由mdnice多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/754398.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于Java的大学生租房系统

你好呀,我是计算机学姐码农小野!如果有相关需求,可以私信联系我。 开发语言:Java 数据库:MySQL 技术:SpringBoot框架,MVC模式 工具:Vscode,MySQL,B/S架构…

计算机网络之OSI七层体系结构

目录 1.物理层 1.1物理层组成 1.2物理层功能 1.3物理层服务 1.4物理层标准 1.5物理层接口 2.数据链路层 2.1基于物理层的问题 2.2数据链路层功能 2.3数据链路层服务 2.4数据链路层协议 3.网络层 3.1基于DL层的问题 3.2网络层功能 3.3网络层服务 3.4网络层协议 …

根据肥胖类型选择减调方向收获窈窕身材

我们生活中胖子很多,从胖到瘦的人也不少,但瘦了后对自己身材满意的人却是不多的,很多人瘦了也只是减掉了身上的赘肉而已,大体的身形却是没有变化的,因此,并不感到满意。因为他们本身的形体是固定的&#xf…

拼多多面试总结

文章目录 一面自我介绍提问算法反问结果 二面提问算法反问结果 主管面主管面试准备算法题其他个人提问准备 提问数据库普通索引和覆盖索引的区别索引是什么?索引怎么加快数据库查询的?索引具体怎么实现的?以B树为例,节点放了什么&…

java生成excel,uniapp微信小程序接收excel并打开

java引包&#xff0c;引的是apache.poi <dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>5.2.3</version></dependency> 写一个测试类&#xff0c;把excel输出到指定路径 public s…

leetcode494. 目标和

1.思想方法 2.代码 class Solution { public int findTargetSumWays(int[] nums, int target) {int sum 0;for(int num : nums)sum num;if(sum < Math.abs(target) || (targetsum)%2 ! 0)return 0;int x (targetsum) / 2,n nums.length;//基于滚动数组的方法int[] dp…

JavaWeb-day28_HTML

今日内容 零、 复习昨日 一、HTML 零、 复习昨日 一、Web开发 前端三大件 HTML ,页面展现CSS , 样式JS (JavaScript) , 动起来 二、HTML 2.1 HTML概念 ​ 网页&#xff0c;是网站中的一个页面&#xff0c;通常是网页是构成网站的基本元素&#xff0c;是承载各种网站应用的平台…

MySQL高级-SQL优化- count 优化 - 尽量使用count(*)

文章目录 1、count 优化2、count的几种用法3、count(*)4、count(id)5、count(profession)6、count(null)7、 count(1) 1、count 优化 MyISAM引擎把一个表的总行数存在了磁盘上&#xff0c;因此执行count&#xff08;*&#xff09;的时候会直接返回这个数&#xff0c;效率很高&a…

阿里云nginx更新证书后依旧显示旧证书

尝试的解决办法 重启nginx服务删除服务器上的旧证书清除浏览器缓存检查是否使用CDN服务 最后的解决办法 云服务器开启了WAF服务&#xff0c;在WAF服务中配置证书

MySQL学习(5):SQL语句之数据查询语言:DQL

1.DQL语法 select 字段列表 from 表名列表 #DQL是可以进行多表查询的 where 条件列表 group by 分组字段列表 having 分组后条件列表 order by 排序字段列表 limit 分页参数 2.基本查询&#xff08;select&#xff09; 2.1查询多字段 select 字段1,字段2,字段3,......fro…

重要通知:据最新TEMU要求所有欧区车灯都需要能效标签(eu energy lable)

重要通知&#xff1a; 据最新TEMU要求&#xff0c;所有“欧区车灯”都需要能效标签&#xff08;eu energy lable&#xff09;&#xff0c;目前已下架欧区站点&#xff0c;上传成功后可恢复。 灯具类欧盟EU ENERGY LABEL 近日有不少欧洲站卖家收到TEMU平台商品要求卖家们发布的…

SHELL脚本学习(十二)sed进阶

一、多行命令 概述 sed 编辑器的基础命令都是对一行文本进行操作。如果要处理的数据分布在多行中&#xff0c;sed基础命令是没办法处理的。 幸运的是&#xff0c;sed编辑器的设计人员已经考虑了这个问题的解决方案。sed编辑器提供了3个处理多行文本的特殊命令。 命令描述N加…

大数据学习之分布式数据采集系统Flume学习

分布式数据采集系统Flume学习 一、Flume架构 1.1 Hadoop业务开发流程 1.2 Flume概述 flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 支持在日志系统中定制各类数据发送方&#xff0c;用于收集数据; 同时&#xff0c;Flume提供对数据进行简单处理&…

如何在720漫游中设置付费观看?

1. 进入720漫游作品编辑器&#xff0c;点击 「全局设置-营销设置-付费观看设置」 即可打开付费观看设置栏&#xff1b; 720漫游编辑器-全局设置 2. 开启付费观看功能后&#xff0c;设置「付费金额」&#xff0c;选择「付费场景」即可 720漫游编辑器-全局设置-付费观看设置 3.…

CentOS 生命周期结束指南

2019 年 9 月&#xff0c;Red Hat 宣布打算废止 CentOS&#xff0c;并将其替换为 CentOS Stream。 CentOS 7 和 8 是 CentOS Linux 的最终版本。CentOS 7 和 8 的生命周期结束日期为&#xff1a; CentOS 8 - 2021 年 12 月 31 日 CentOS 7 - 2024 年 6 月 30 日 相关内容推荐 点…

【人工智能学习之图像操作(三)】

【人工智能学习之图像操作&#xff08;三&#xff09;】 图像滤波滤波概念卷积平滑算子均值滤波高斯滤波中值滤波双边滤波锐化算子USM锐化梯度算子 傅里叶变换直方图直方图直方图均衡化自适应均衡化2D 直方图直方图反向投影 图像滤波 滤波概念 滤波过程就是把不需要的信号频率…

【D3.js in Action 3 精译】1.1.2 D3.js 的适用场景

译注 上一节中我们了解了 D3 诞生的技术背景——为了满足 Web 可访问数据的可视化需求。本节再来看看 D3.js 的适用场景是怎样的、在什么时候会考虑使用 D3.js。 1.1.2 D3.js 的适用场景 数据可视化领域正蓬勃发展&#xff0c;且备受青睐。过去十年间用于生成数据驱动图形的工…

Vite脚手架+Vant组件库初始化前端项目

脚手架概念&#xff1a; 在前端开发中&#xff0c;脚手架&#xff08;Scaffold&#xff09;是指一个用于快速搭建项目基础结构的工具或模板。脚手架包含了项目所需的基本文件结构、配置文件、依赖管理等内容&#xff0c;使开发者能够更快速地开始项目开发&#xff0c;而不必从…

H-K算法介绍与MATLAB实现

本篇文章是博主在人工智能等领域学习时&#xff0c;用于个人学习、研究或者欣赏使用&#xff0c;并基于博主对人工智能等领域的一些理解而记录的学习摘录和笔记&#xff0c;若有不当和侵权之处&#xff0c;指出后将会立即改正&#xff0c;还望谅解。文章分类在AI学习笔记&#…

sql想查询一个数据放在第一个位置

sql想查询一个数据放在第一个位置 背景:比如在查询后台账号的时候想将管理员账号始终放在第一个,其他账号按照创建时间倒序排序, 可以这样写sql: SELECTid,create_time FROMuser ORDER BY CASEWHEN id 1 THEN1 ELSE 2 END ASC, create_time DESC 运行截图: 可以看到id…