未分类认识大模型Embedding技术,加代码实战2原创 皇子 皇子谈技术 2024年03月21日 19:54 广东 大家好,我是皇子。 有朋友说想学习大模型应用开发技术,让我谈一谈。 首先大模型应用开发技术不需要我们掌握机器学习和深度学习的算法,但是要有编程思维,python 基础,然后跟着下面的步骤走,就能学得明白。 下面正式开始认识大模型 Embedding 的理...赞 (0)2025-03-26阅读(47)评论(0)
未分类讲清 Transformer 模型架构论文(四)8原创 huangz 皇子谈技术 2024年01月09日 08:49 广东 今天要分享的是整个论文中最核心的部分“模型架构(Model Architecture)” Transformer 模型架构论文《Attention Is All You Need》发表在 NeurIPS 会议上,同时受到论文模板的影响,论文篇幅极...赞 (0)2025-03-26阅读(36)评论(0)
未分类讲清 Transformer 模型架构论文(三)1原创 皇子 皇子谈技术 2024年01月08日 09:20 广东 Transformer 模型架构论文《Attention Is All You Need》发表在 NeurIPS 会议上,同时受到论文模板的影响,论文篇幅极致压缩为 8 页的精华,所以我接下来打算分为几部分来讲清,论文地址放在底部链接。 讲清 Trans...赞 (0)2025-03-26阅读(48)评论(0)
未分类讲清 Transformer 模型架构论文(二)1原创 huangz 皇子谈技术 2024年01月07日 09:26 广东 Transformer 模型架构论文《Attention Is All You Need》发表在 NeurIPS 会议上,同时受到论文模板的影响,论文篇幅极致压缩为 8 页的精华,所以我接下来打算分为几部分来讲清<上一篇请看:讲清 Tran...赞 (0)2025-03-26阅读(38)评论(0)
未分类讲清 Transformer 模型架构论文(一)1原创 huangz 皇子谈技术 2024年01月05日 08:10 广东 Transformer 模型架构论文《Attention Is All You Need》发表在 NeurIPS 会议上,同时受到论文模板的影响,论文篇幅极致压缩为 8 页的精华,所以我接下来打算分为几部分来讲清,论文地址放在底部链接。 Neur...赞 (0)2025-03-26阅读(41)评论(0)
未分类LLM经典论文速读版,看完感觉自己通透了32读不下去的,略读也是不错,美名曰“好读书,不求甚解;每有会意,便欣然忘食。” 大家好,我是皇子。 对于渴望深入理解AI的爱好者和研究者来说,阅读经典论文不仅是获取知识的途径,更能让我们产生新的思维方式。 历史文章分享过一次《Attention is All You Need》论文的精读,我也不是算法和机器学习的从业者,有很多不解,但是不影响我在后面学习大语言...赞 (0)2025-03-26阅读(44)评论(0)
未分类[论文分享]On the Opportunities and Risks of Foundation Models前言 写这个专栏的初衷之一,除了分享一些工作中敝帚自珍的心得之外,更多的是立个flag,希望自己能够对前沿的知识保持关注和好奇。 尽管已经不能像学生时代一样,有那么多的时间深入理解和复现论文,但是从工业的角度出发,解读前沿的研究成果,虽避免不了断章取义,但总归是开卷有益。 作为机器学习领域目前最前沿的相关研究,foundation models(中文通常称之...赞 (0)2025-03-26阅读(47)评论(0)
未分类【AI大模型】非技术背景,一文读懂大模型(长文)6一、写在前面 写这篇文章的初衷,源于近期涌起的唱衰AI大模型的风潮。不少人在对大模型的机制及当下的商业形态进行了初步了解后,便断言大模型是一场“骗局”,是资本操控的闹剧。同时,近来不管是投资领域还是各大厂,似乎都开始谨慎衡量做大模型这件事的投资回报率(ROI)。难道大模型当真不像去年众人所认定的那样,是一场所谓的“革命”吗? 唱衰大模型的人,大多持有这样的观...赞 (0)2025-03-26阅读(39)评论(0)
未分类DeepSeek:技术洞察与解析(深度好文)目录 DeepSeek的AGI行业地位 DeepSeek的技术突破 DeepSeek的核心技术 DeepSeek的工作流程 DeepSeek的实现过程 DeepSeek的算法贡献 DeepSeek v3算法核心原理详解 DeepSeek的未来前景 DeepSeek,全称 杭州深度求索人工智能基础技术研究有限公司 。DeepSeek 是一家创新型科技公司 ,成...赞 (0)2025-03-26阅读(43)评论(0)
未分类AI大模型系列之一:大模型原理科普(深度好文)目录 认识AI大模型家族 AI是什么? 机器学习是什么? 机器学习有哪些分支? 什么是强化学习? 深度学习属于哪一类学习? 生成式AI和深度学习是什么关系? 大语言模型是什么? 所有大语言模型都是生成式AI? 大语言模型LLM (large language model)到底是个啥? 大模型LLM的“大”是什么含义? LLM核心技术到底是什么? 为什么Tra...赞 (0)2025-03-26阅读(42)评论(0)
一周热门排行