- 博客(1096)
- 收藏
- 关注

原创 2024年史上最难就业季,该如何逆风翻盘?
IT互联网依然是大学生最向往行业,制造业受欢迎度升高智联招聘调研数据显示,2024届求职毕业生期望行业中,IT/通信/电子/互联网、政府/非盈利机构、文化/传媒/娱乐/体育行业位列前三,占比分别为26.4%、9.4%、8.9%。IT互联网行业为应届生贡献很多就业岗位,也是应届生最向往的行业。
2024-06-20 13:43:59
3468

原创 AI产品经理,应掌握哪些技术?
当下,人工智能AI产品经理这一块不失为一个好的发展方向吗,如果你想要快速入局却又找不到方法,那么在这里我为大家总结了一套系统的学习方法,方便大家成型的学习,有需要的朋友可以扫描下方二维码,免费获取更多相关学习资料。
2024-06-17 19:47:49
1428

原创 金融与大模型:引领行业未来的创新融合
金融与大模型的结合是行业发展的必然趋势,也是金融行业实现数字化转型和创新发展的关键。面对这一机遇和挑战并存的局面,我们应积极拥抱变革、勇于创新实践。通过强调金融大模型的优势、打造成功案例、建立合作关系和创新服务模式等多种手段相结合的方式,共同推动金融大模型在行业的广泛应用和普及发展。那么,我们该如何学习大模型?作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。
2024-06-13 13:44:07
3022

原创 程序员为什么要学习AI大模型?
在科技浪潮的推动下,人工智能(AI)技术已经成为推动软件行业发展的核心动力。而在AI技术的众多分支中,AI大模型以其巨大的潜力和广泛的应用场景,逐渐成为了程序员们关注的焦点。本文将从程序员的角度出发,探讨AI大模型的定义、应用,以及为何程序员需要深入了解大模型的相关知识。
2024-06-06 18:26:08
3350
1
原创 AI大模型2025最新学习路线:从零基础到进阶,超详细技术学习指南,一篇掌握核心知识!
学习大模型技术是一个从零散到系统的过程,涉及理论、技术和应用的多方面梳理。大模型技术是人工智能的一个分支,主要通过深度学习算法模仿人类大脑神经元,实现智能。其核心是神经网络架构,如CNN、RNN、Transformer等,通过正向传播、损失计算和反向传播调整参数,实现类智能能力。大模型通常采用预训练方式,分为监督学习和无监督学习,针对不同任务设计不同神经网络。随着模型规模增大,训练难度和成本也增加,因此出现了强化学习、迁移学习等技术。多模态大模型进一步提升了技术复杂度。RAG技术通过外挂知识库扩展大模型能力
2025-05-15 20:43:04
619
原创 2025年大模型产品经理学习路线图:从零基础到精通,一篇详细攻略助你成为大模型行业精英!
随着人工智能技术的快速发展,尤其是大模型的兴起,企业对相关人才的需求急剧增加。大模型产品经理作为这一领域的核心角色,需要具备跨学科的知识和技能,包括计算机科学、人工智能、产品管理和商业分析等。学习路线从基础知识入手,涵盖数据结构、编程语言、机器学习原理等,逐步深入到大模型技术、分布式训练、模型优化等高级内容。此外,产品思维、商业模式分析以及实战经验积累也是不可或缺的部分。通过持续学习和项目实践,大模型产品经理可以不断提升自身能力,适应行业变化,抓住职业发展机遇。
2025-05-15 20:35:59
714
原创 深度解析!阿里Qwen3部署全攻略:从代码到实战,手把手教你打造智能应用(附10大行业案例)
2025年Qwen3的发布标志着中国AI技术进入新纪元。这款集混合专家系统(MoE)、动态推理架构、全模态支持于一身的模型,不仅登顶全球开源大模型榜单,更以“参数效率提升300%、推理成本降低55%”的突破性表现引发行业震动本文将从环境配置、模型加载、推理优化、多模态整合四大维度,结合10个真实行业案例,深度拆解Qwen3部署的核心技术。Qwen3的MoE架构采用分层稀疏调度技术,开发者可通过配置文件灵活控制专家激活策略:个人观点:这种“按需分配”的机制大幅降低了显存占用。以30B-A3B模型为例,其推理显
2025-05-15 20:31:58
414
原创 中国智算中心产业发展白皮书(2025年)|附63页PDF文件下载
智算中心作为信息基础设施的重要组成部分,通过算力的生产、聚合、调度和释放,能够为快速增长的人工智能算力需求提供基础支撑,在推进AI产业化、赋能产业AI化、助力治理智能化、促进产业集群化等方面具有显著作用是数字经济时代促进科技创新、优化产业结构、提升国家竞争力的重要支撑。中国智算中心产业迎来重要发展机遇。
2025-05-15 20:28:42
510
原创 程序员需要了解的大模型开发方向!
随着GPT的爆火,大模型方向近期也迎来越来越多的机会和发展。而且作为工作几年CRUD的后端,感觉后端开发是越来越卷了。这里也不是鼓励大家赶紧去转大模型,可以先了解一下新的行业,新的机会,更好的规划自己未来的职业发展。现在招聘大模型的岗位还是比较少的,而且也出现很多培训大模型的(大部分是收割韭菜的,大家也别被骗了)。大模型数据工程师:数据清洗/ETL/Data Engine/Pipeline大模型平台工程师:分布式训练/大模型集群/工程基建大模型算法工程师:搜广推/对话机器人/AIGC等。
2025-05-15 20:22:19
613
原创 中文大模型忠实性幻觉测评:标杆R1幻觉率21%,千问3达29%,豆包1.5仅4%
SuperCLUE-Faith是一个专门评估大语言模型在中文生成任务中应对忠实性幻觉的测试基准。该基准通过文本摘要、阅读理解、多文本问答和对话补全四大任务,全面衡量模型在生成内容时的忠实性表现。测评结果显示,模型间的幻觉表现差异显著,极差高达28.69%,其中doubao-1.5-pro-32k以95.89%的准确率和仅4.11%的幻觉率位居榜首。推理模型的幻觉率比非推理模型高出近9.43%,且任务开放性越高,模型的幻觉越严重。SuperCLUE-Faith通过多维度评测,为大语言模型的忠实性幻觉研究提供了
2025-05-15 20:20:18
405
原创 【AI大模型开发】MCP、RAG、Agent架构设计间的关系总结
本文深入探讨了人工智能领域的三大核心技术:MCP(模型上下文协议)、RAG(检索增强生成)和Agent(智能体),并解析了它们之间的内在联系。RAG通过结合信息检索与文本生成,提高了AI生成内容的准确性和可靠性;Agent则是一种能够自主感知、决策和行动的AI系统,增强了AI的自主性和灵活性;MCP作为一种开放标准,简化了AI系统与外部系统的集成过程。文章通过图解和案例生动地展示了这些技术如何协同工作,构建出强大、可靠且适应性强的AI系统,推动人工智能技术的应用和发展。
2025-05-15 19:45:59
541
原创 新人转行大模型避坑指南:真诚建议助你少走弯路,顺利转型AI领域!非常详细收藏这一篇就够!
大模型赛道前景广阔,但盲目追求算法岗位可能带来风险。文章分享了四个关键真相:1)大模型岗位分为数据、平台、应用和部署四大方向;2)新人应避免过度关注调参,重视数据敏感度和垂直领域经验;3)入行路径包括大厂实习、中小厂项目积累或社招内部转岗;4)数据与工程岗位比算法岗位更容易上岸。文章还提到大模型岗位的薪资优势和行业需求,强调掌握AI工具的重要性,并提供了学习路径和资源,帮助读者在大模型领域找到适合自己的发展方向。
2025-05-14 20:23:49
1304
原创 大模型入门指南:从零开始,五本必读书籍推荐,非常详细收藏这一篇就够!
本文为初学者提供了大模型学习路线图和推荐书籍,帮助零基础者快速入门大模型应用开发。文章首先介绍了大模型在人工智能领域的重要性,随后详细列出了学习路线图,并推荐了五本关键书籍,包括《Python编程:从入门到实践》、《深度学习数学基础》、《机器学习实战》、《深度学习》和《大模型应用开发极简入门:基于GPT-4和ChatGPT》。这些书籍涵盖了从编程基础到深度学习理论及实践的全方位知识,旨在为读者提供系统化的学习路径,助力其掌握大模型的核心技能。
2025-05-14 20:21:50
484
原创 Qwen3技术报告解读
上个月29日,Qwen3开源了一系列模型,包括6个Dense模型和2个MoE模型,这些模型在架构上与Qwen2.5相似,但进行了多项优化,如移除QKV偏置和引入QK-Norm。预训练数据涵盖36TTokens,涉及119种语言和方言,分为通用、推理和长上下文三个阶段。后训练流程包括思考控制和强到弱蒸馏,旨在优化模型推理能力和减少计算成本。Qwen3还通过CoT冷启动和推理强化学习进一步提升了模型的推理能力。此外,Qwen3设计了聊天模板,允许用户动态切换模型的思考过程。通用强化学习阶段则增强了模型在多种场景
2025-05-14 20:17:39
596
原创 全球首个通用型Agent诞生!Manus行业全解析,附相关标的,引领AI技术新潮流!
Manus,一款曾经一码难求的通用Agent智能体,现已开放国际版注册。该产品由北京Monica.im团队开发,旨在通过人工智能技术自主执行复杂任务,无需人类监督。Manus的核心优势包括全自主任务执行、多智能体协作架构、多模态交互能力、深度外部工具集成以及云端异步执行与持久化记忆。目前,Manus已与阿里通义千问团队合作,开发新版本应用,并开放了国际版注册,用户登录即可获得积分奖励。Manus的推出标志着AI智能体在任务执行和自动化处理方面的重大进步,尽管面临国内注册限制和价格较高等挑战,但其在GAIA基
2025-05-14 20:12:50
581
原创 理解什么是AI Agent,看懂这篇就够了
AIAgent逐渐取代传统的对话式大模型,成为人工智能领域的新焦点。AIAgent通过整合多种组件模块,如工具、记忆和规划能力,显著提升了LLM(大语言模型)的功能。传统LLM作为概率预测模型,虽能生成连贯对话,但在记忆和精确计算任务上存在局限。通过引入外部工具和记忆系统,LLM的能力得到增强,形成“增强式LLM”,使其能够更有效地执行复杂任务。AIAgent的核心在于其规划能力,通过链式思维和推理,能够分解任务并逐步执行。此外,AIAgent的记忆系统分为短期和长期记忆,通过外部向量数据库实现信息的长期存
2025-05-14 20:10:01
712
原创 详解 MCP 传输机制
MCP传输机制是MCP客户端与服务器通信的桥梁,定义了通信细节并支持消息交换。MCP协议使用JSON-RPC编码消息,要求UTF-8编码。目前定义了三种传输机制:stdio(通过标准输入输出通信,适用于本地进程)、SSE(通过HTTP流式传输,即将废弃)、StreamableHTTP(通过HTTP流式传输,替代SSE)。MCP协议推荐使用stdio传输,但支持自定义传输机制。stdio传输通过子进程启动服务器,使用标准输入输出进行消息交换,适合本地通信,但无法并行处理多个请求。SSE传输基于HTTP,支持远
2025-05-14 20:08:00
628
原创 2025年最新大模型学习路线规划:零基础入门到精通,全面掌握大模型开发技能!大模型学习路线
本文介绍了学习AI大模型的七个阶段,从基础理论入门到前沿技术探索,逐步深入掌握大模型的核心技术、编程基础、实战项目、高级应用开发、模型微调与私有化部署等技能。通过学习,学员能够基于大模型全栈工程实现,解决实际项目需求,掌握GPU算力、LangChain开发框架和项目实战技能,完成热门大模型垂直领域模型训练,提升编码能力和分析能力。文章还提供了丰富的学习资源,包括AI大模型学习路线图、商业化落地方案、视频教程、PDF书籍、面试题合集和AI产品经理资源合集,帮助学员全面提升大模型应用开发能力。
2025-05-12 14:16:34
1105
原创 2025年大模型产品经理转型指南:零基础入门到精通的全面详细教程,一篇掌握所有关键知识点!
大模型作为AI领域的重要趋势,具备强大的泛化能力和适应能力,正逐渐改变技术应用场景。对于AI产品经理而言,转行做大模型需要具备对AI技术的深入理解、数据敏感度、用户需求洞察力、产品设计思维以及团队协作能力。评估自身是否适合转行,可以从对AI技术的兴趣、数据处理能力、用户需求理解、产品设计技巧和团队协作态度等方面进行判断。若具备较高水平,可大胆转行;若存在不足,可逐步提升技能并积累实践经验;若兴趣或优势不足,则可考虑其他领域。学习大模型相关知识,可从神经网络、深度学习、变换器架构等原理入手,结合权威教材和前沿
2025-05-12 14:14:21
534
原创 什么是RAG? RAG技术入门指南:小白也能轻松掌握的大模型RAG技术实践总结
RAG(Retrieval-Augmented Generation)技术结合了信息检索与生成模型,旨在通过检索大量信息并生成准确、丰富的回答。其核心步骤包括索引、检索和生成。索引阶段对文档进行预处理,检索阶段从知识库中快速找到相关信息,生成阶段则利用先进模型整合信息并生成上下文相关的回答。RAG技术在大模型(LLM)中应用广泛,尤其在智能客服领域,能够提升服务效率,减少生成幻觉,并通过更新外部知识库保持信息时效性。智谱RAG方案通过信息检索模块、生成模块及系统集成与优化,进一步推动了该技术在智能客服中的应
2025-05-12 14:12:10
656
原创 什么是Agent?深入解析Agent的核心概念与理解之道
Agent作为大模型技术的重要应用,其定义和功能在业界尚未完全统一。OpenAI提出了两种定义:一是能够独立完成任务的系统,二是配备指令和工具的大语言模型。Agent的核心在于其自主理解、规划决策和执行复杂任务的能力,被视为智能时代的App形态。大语言模型(LLMs)作为Agent的基础,通过循环生成Token的方式处理信息,但缺乏获取新知识和调用外部工具的能力。知识问答助手(RAG)通过保存会话上下文和引入私有知识库,扩展了LLMs的能力,而AgenticRAG则进一步融合了Agent的动态规划和自主决策
2025-05-12 14:09:25
669
原创 这份谷歌提示词指南,让你秒变Prompt高手!
随着ChatGPT、Gemini等大型语言模型(LLM)的广泛应用,如何有效与AI对话并引导其完成任务成为关键。提示词工程(Prompt Engineering)正是这一过程的核心技能,它通过设计高质量的提示词,引导LLM生成准确、相关且符合预期的输出。提示词工程不仅适用于数据科学家,也是每个与LLM互动者应掌握的能力。谷歌发布的《提示词工程说明手册》详细介绍了从基础到进阶的提示词技术,如零样本与少样本、设定身份与场景、提升模型推理能力等,并提供了最佳实践建议,如保持简洁清晰、明确输出要求等。掌握提示词工程
2025-05-12 14:06:58
813
原创 RAGflow安装教程:保姆级指导,小白也能快速上手!
文章首先介绍了RAGflow,一个开源的检索增强生成引擎,它在文档管理方面具有优势,能够帮助用户构建高准确性和可信度的智能知识库。接着,文章详细描述了RAGflow的安装过程,包括代码下载、Docker服务管理、端口修改、状态查看以及遇到的问题和解决方案。最后,文章分享了一个关于AI大模型学习的详细路线图,包括系统设计、提示词工程、平台应用开发、知识库应用开发、微调开发、多模态大模型应用以及大模型平台应用与开发等多个阶段,并提供了获取相关学习资源的方式。
2025-05-12 14:04:36
729
原创 2025最详细的学习路线,零基础入门大模型教程,让你少走99%弯路!【值得收藏】
大模型AI学习路径分为七个阶段,涵盖从基础理论到高级应用开发的全过程。第一阶段介绍大模型的基本概念和背景,包括人工智能演进、GPT模型发展等。第二阶段深入解析核心技术,如Transformer架构、预训练和微调技术。第三阶段聚焦编程基础与工具使用,掌握Python和提示工程。第四阶段通过实战项目(如代码生成、文档助手)提升应用能力。第五阶段学习高级应用开发,包括大模型API、RAG和向量数据库。第六阶段涉及模型微调与私有化部署,学习HuggingFace等工具。第七阶段探索前沿技术,如多模态模型和参数高效微
2025-05-10 14:05:54
856
原创 从大数据到AI:我为何选择转行大模型领域,揭示个人职业转型之路
作为一名经验丰富的大数据开发工程师,我决定转型至大模型应用开发,这一选择基于对技术趋势、市场需求和职业发展的深入分析。大数据技术已逐渐成为基础设施,而AI与大数据的融合则推动了复杂AI模型的广泛应用。大模型作为AI与大数据的集大成者,展现了巨大的发展潜力。我的大数据处理能力、分布式系统经验以及从ETL到MLOps的演进,为这一转型提供了自然过渡。此外,企业对AI解决方案的需求激增、大模型应用的多样性以及人才缺口,为大模型开发提供了广阔的市场前景。这一转型不仅拓展了我的技术广度,还为职业发展开辟了新的路径,甚
2025-05-10 14:04:21
862
原创 大模型(LLM)与智能体(Agent):深入了解两者间的关键区别
大模型(LLMs)与智能体(Agent)在功能和应用场景上有显著区别。大模型如GPT、BERT专注于自然语言处理,擅长文本生成、翻译、问答等任务,技术实现上依赖深度学习和自监督学习。智能体则具备感知、决策和行动能力,可应用于自动化系统、游戏AI、工业自动化等领域,技术实现结合深度学习、强化学习等多重技术。两者在智能客服等场景中有交集。随着大模型的广泛应用,相关岗位需求激增,学习大模型成为职业发展的重要方向。建议通过系统学习,掌握提示词工程、RAG系统、智能体开发等技能,抓住这一技术风口。
2025-05-10 14:00:46
810
原创 GitHub超3万星!LLM大模型入门教程,业界最热门资源一网打尽
这篇博客介绍了一门关于大型语言模型(LLM)的课程,分为三个主要部分:LLM基础、LLM科学家和LLM工程师。LLM基础部分涵盖了机器学习所需的数学知识、Python编程技能以及神经网络的基本概念。LLM科学家部分专注于如何构建和优化LLM,包括模型架构、数据集构建、预训练和微调技术。LLM工程师部分则关注如何将LLM应用于实际场景并进行部署。课程提供了丰富的学习资源,如视频教程、书籍和开源工具,帮助学习者从理论到实践全面掌握LLM的开发与应用。
2025-05-10 13:59:12
669
原创 必看!大模型训练圣经《从头训练大模型》免费PDF分享
《Current Best Practices for Training LLMs from Scratch》是由Weights & Biases(W&B)发布的一份关于从头训练大型语言模型(LLMs)的权威指南。该白皮书详细探讨了LLMs训练的最佳实践,涵盖了数据收集与处理、模型架构选择、训练技巧与优化策略、模型评估与部署等关键环节。指南首先讨论了是否应从头训练LLM或使用现有商业API或开源LLM,接着介绍了训练LLM的三种基本方法:使用商业LLM的API、使用开源LLM、以及自己预训练LLM。此外,指
2025-05-10 13:55:06
533
原创 AI Agents入门教程之Workflow vs Agent
本文深入探讨了AI工作流与AI智能体的区别及其应用场景。AI工作流通过预定义路径协调任务,适用于结构清晰的任务;而AI智能体则具备动态决策能力,适合复杂、灵活的任务。文章详细介绍了多种工作流类型,如提示链、并行化、路由机制等,并展示了智能体系统的实现框架,如LangGraph、Amazon Bedrock等。此外,文章强调了在开发AI系统时应从简单方案入手,仅在必要时引入复杂架构,并提供了相关代码示例和最佳实践建议,帮助开发者构建可靠、高效的AI应用。
2025-05-10 13:52:02
1006
原创 OpenAI 发布企业运用 AI 大模型的 7大场景
OpenAI提供了两种主要类型的模型:推理模型(如o1和o3-mini)和GPT模型(如GPT-4o)。推理模型擅长处理复杂任务,适合需要深入思考和策略规划的领域,如金融、法律和科学。GPT模型则更注重速度和成本效益,适合执行明确定义的任务。开发者应根据任务需求选择模型:若需高准确性和复杂问题解决,选择推理模型;若需快速执行和成本控制,选择GPT模型。OpenAI还分享了推理模型的七大应用场景,包括处理模糊任务、从大数据集中提取关键信息、多步骤智能规划等,展示了其在金融分析等领域的成功案例。
2025-05-10 13:47:43
603
原创 神仙级大模型教程分享,大模型学习路线(2025最新)非常详细收藏这一篇就够
大模型学习路线图第一阶段:基础知识准备在这个阶段,您需要打下坚实的数学基础和编程基础,这是学习任何机器学习和深度学习技术所必需的。1. 数学基础学习资料2. 编程基础学习资料第二阶段:机器学习基础这一阶段主要涉及经典机器学习算法的学习,以及如何使用它们解决实际问题。1. 机器学习理论学习资料第三阶段:深度学习入门在这个阶段,您将学习深度学习的基本概念和框架。1. 深度学习基础学习资料2. 深度学习框架学习资料第四阶段:自然语言处理基础本阶段将介绍自然语言处理的基本概念和技术。
2025-05-09 15:39:20
1014
原创 大模型开发入门:一文精通Fine-tuning(大模型微调)!
*的本质**********Fine-tuning(微调):**一、微调的定义大模型微调是利用特定领域的数据集对已预训练的大模型进行进一步训练的过程。它旨在优化模型在特定任务上的性能,使模型能够更好地适应和完成特定领域的任务。二、微调的核心原因定制化功能:微调的核心原因是赋予大模型更加定制化的功能。通用大模型虽然强大,但在特定领域可能表现不佳。
2025-05-09 15:37:34
673
原创 如何赋能医疗AI大模型应用?
自ChatGPT掀起热潮以来,众多AI大模型如雨后春笋般涌现,其中包括百度科技的文心一言、科大讯飞的讯飞星火、华为的盘古AI大模型、腾讯的混元AI大模型以及阿里哪吒大模型等。业界戏称这一现象为“百模大战”。不仅如此,这些通用AI大模型还逐渐渗透到各个垂直行业中,其中生命科学和医疗健康行业成为了拓展速度较快的一个领域。从2023年2月至10月初,国内市场上便出现了近50个针对医疗领域的大型模型。
2025-05-09 15:26:14
1045
原创 大模型在运维场景中的应用
企业IT运维一体化场景涵盖了多个运维活动,日常维护、变更发布、故障应急、服务响应、优化提升、安全管控等均需要跨多个运维领域完成,场景驱动了各个业务域之间的业务集成和技术集成设计。在现代企业中,DevOps是确保系统高效运行的关键领域。然而,随着技术环境的日益复杂,运维团队面临着越来越多的挑战。尤其在处理大量数据和迅速应对突发情况时,传统的运维工具和方法显得力不从心。大模型技术应运而生,为运维中的知识管理带来了革命性的变化。智能运维实践可以帮助企业更好地理解和管理这些复杂的系统。
2025-05-09 15:24:12
619
原创 Gemini 2.5 Pro Preview 05–06:一款面向开发者的 AI 编程助手
Gemini 2.5 Pro Preview 05–06 以“面向开发者”“注重可用性”为核心,不仅能生成高质量前端代码,还能理解视频教程并输出互动式学习工具。在日常开发、快速原型和代码重构场景中,能有效提升效率、减少沟通成本。如果你正寻找一款“更懂开发者”的 AI 编程助手,不妨亲自试试这款新版本。
2025-05-09 15:19:39
851
原创 9000字落地实操:AI做用户购后评论洞察分析
从海量用户评价中剖析出市场需求,无异于沙里淘金。一方面在于用户评价很多时候是不痛不痒的「中评」,看不出来顾客到底想表达什么?另一方面在于「海量」,评价太多了,根本看不完,如果用传统的python等工具分析,工作量又非常大。更不用说:
2025-05-09 15:15:47
557
原创 一下午面了三个AI产品经理,一问三不知!AI产品经理面试秘籍:高频问题及答案全解析!
作为AI产品经理,首要的职责都是去定义一个 AI 产品。这包括,搞清楚这个行业的方向,这个行业通过 AI 技术可以解决的问题,这个 AI 产品具体的应用场景,需要的成本和它能产生的价值。这就要求 AI 产品经理除了具备互联网产品经理的基础知识之外,还需要了解 AI 技术的边界,以及通过 AI 技术能够解决的问题是什么。
2025-05-08 17:47:00
927
原创 AI产品经理VS传统产品经理:工作差异详解,非常详细收藏这一篇就够!
AI 产品经理是直接应用或间接涉及了 AI 技术,进而完成相关 AI 产品的设计、研发、推广、产品生命周期管理等工作的产品经理。具体来说,狭义 AI 产品经理直接应用了语义、语音、计算机视觉和机器学习这 4 个领域的 AI 技术,例如语义类 AI 产品经理中的知识图谱 PM、机器翻译 PM 等;广义 AI 产品经理间接涉及了这些技术或直接应用了其他还不够成熟的细分领域 AI 技术。
2025-05-08 17:44:21
826
原创 大模型LLM Qwen2.5全攻略:全链路体验、下载、推理、微调、部署实战,非常详细收藏这一篇!
在数学专用语言模型方面,通义千问上个月发布了首批模型 Qwen2-Math,而这一次,相比于 Qwen2-Math,Qwen2.5-Math 在更大规模的数学相关数据上进行了预训练,包括由 Qwen2-Math 生成的合成数据。Qwen2.5-Math-72B-Instruct 的整体性能超越了 Qwen2-Math-72B-Instruct 和 GPT4-o,甚至是非常小的专业模型如 Qwen2.5-Math-1.5B-Instruct 也能在与大型语言模型的竞争中取得高度竞争力的表现。
2025-05-08 17:41:41
863
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人