置顶文章

1.4k 1 分钟

# GPT 是什么?直观解释 Transformer 来源:【官方双语】GPT 是什么?直观解释 Transformer | 深度学习第 5...
19k 17 分钟

# 水仙花数 水仙花数,即一个三位数,其各位数字的立方和等于该数本身。例如:153 = 1^3 + 5^3 + 3^3。找出所有的水仙花数并打印出来。 def ques1(): for i in range(1, 1000): num = i sum_of_cubes = 0 while num > 0: digit = num % 10 sum_of_cubes += digit ** 3 num //= 10 if sum_of_cubes == i: print(f"{i}是一个水仙花数。")if __name__ ==...
16k 15 分钟

# 生成微调数据 # 准备工作 DISC-LawLLM 主要基于 DISC-Law-SFT-Pair 和 DISC-Law-SFT-Triplet 数据集进行训练,这两个数据集对应了法律专业人员助手、法律咨询服务、法律考试助手、法律专业人员助手和法律咨询服务的情景。 这次实践,使用 Self-Instruct 方法,利用 DISC-Law-SFT-Pair 和 DISC-Law-SFT-Triplet 数据集生成微调数据,以此微调 DISC-LawLLM。Self-Instruct 方法是怎么工作的?如下图: seed tasks 是源数据,Self-Instruct...
219 1 分钟

在多个平台输出的内容类型和定位如下 文字性、知识输出性质:知乎、博客园、公众号。主要做 AI 领域相关,是主要的 IP 阵地之一,主要走知识付费道路。其中,知乎、博客园涉及范围更大,适合硬核长文,公众号适合短文。 视频性质:抖音、视频号。是主要的 IP 阵地之一,主要走 AIGC 工具道路。 壁纸、AIGC、头像等电子虚拟商品:小红书。是主要的 IP 阵地之一,主要走 AIGC 工具道路。 游戏、二次元、娱乐性质:BiliBili。目前定位为纯娱乐,以原创视频为主。

精选分类

文章列表

10k 9 分钟

本章主要内容不是为 pytorch 的所有方法进行详细的讲解,而是提供对 pytorch 的一些必要的、角度不一样的理解。 # 1.tensor 的数据类型 tensor 又称张量,可以认为是计算的基本单元,以浮点数的方式存放在 GPU 中,可以用来存储几乎所有东西,比如参数,梯度,激活值,优化器状态等。 float32: 用 32 位存放一个 tensor 是默认的存储格式,float32 可以简称为 FP32,又称单精度浮点数,或者全精度浮点数(在深度学习里的叫法)。 FP32 由 1 符号位,8 指数位和 23 尾数位(分数位)构成,一个 FP32 数据占 4...
888 1 分钟

投资不是算命祈祷,而是靠逻辑和原则去挑选好公司。 买股票就是买公司。 市场总是摇摆不定,投资者的情绪在极度乐观和悲观之间疯狂摆动,聪明的投资者要学会在别人恐惧时买入,在别人贪婪时卖出,赚极端情绪的钱。 安全边际理论:我们永远不能为一只股票支付过高的价格,这样才能减少踩坑的几率,降低风险。 每个月定期买入优质且被低估的股票,比起手里握着大把现金,把钱投进优秀的公司更靠谱。 先赢的是纸,笑到最后的才是真正的赢家。要追求长久的赢,而不是一时的爽。 价值投资转的不是低买高卖的差价,而是两种溢价,一是优秀企业成长的溢价,二是社会经济发展带来的资产增值。 靠资讯赚钱难以弥补信息差距。有很多专业投资机构,他...
2.8k 3 分钟

​ 最近在向知乎一位执行力极强、十分优秀的博主 @东川路第一伊蕾娜 学习效率与方法论相关的内容。这位博主实现了大一就投出一篇顶会论文,并在不久后进入了大厂实习,继续斩获若干顶会论文。本文特此记录所学思想,并进行自己的思考。 ​ 长久以来,自己主要是单兵作战。除去大学四年为保研而奔波的、需要组队参加的比赛,其他的学习、科研甚至是娱乐也主要是个人进行,几乎完全与 “共赢”...
677 1 分钟

无法继往开来的长远计划不能称之为长远计划。 # 事业轨迹 人生,需要事业有成。 ​ 当下尚未进入到社会生产过程中,并不能产生实际的社会效益和利润,因此在不远的将来仍然会保持学生的身份。所以,当下应该以大模型为核心,扎根 AI 领域,专注于新技术新知识的学习以及能力培养,主攻算法领域,兼修工程技术。 ​ 对于工作类型的选择,个人倾向于算法岗。对于工作单位,个人倾向于在大厂先做一段时间,然后权衡利弊和因素,选择更合适的单位,最后再考虑隐退到二线或者转国企。对于创业,我并不抵触,但是感觉还缺乏时机。 # 生活轨迹 人生,是拿来体验的。 ​ 结束了长达 3...
5.6k 5 分钟

# 1. 资源 课件资料:https://github.com/stanford-cs336/spring2025-lectures clone 下来后,将 var 目录移动到 trace-viewer 中的 public 目录内,将 images 目录也移动到 public 目录内,然后 cd trace-viewer,以此命令 npm install 和 npm run dev,到浏览器打开如下链接来看第一章的课件: http://localhost:5173?trace=/var/traces/lecture_01.json 这个链接只是示例,localhost...
6.4k 6 分钟

​ 我不太清楚,为什么在我身体旺盛,精力旺盛时,因为 i 人又偏偏少异性缘,我不理解为什么要安排我变成这样,感觉很痛苦,还是说这是专门留给我的一份修行?我其实不是觉得我 i 不好,反而我其实觉得我作为一个 i...
175 1 分钟

我发现人每天读书本质上等价于人每天进行一定量的学习。 每天读书有获得感,阅读的是其他领域的书,增长认知和见识。每天进行一定量的学习也是一种形式的读书,只不过学习的内容通常情况下是自己专业的内容,而且也能有获得感。尽管在内容领域方面,两者略有不同,但是本质是一致的,都是每天给自己摄入知识。 果然人不能没有学习,人离不开读书,不然每天的生活也就空洞无味了。
145 1 分钟

bat 命令入门与高级技巧详解 - jack_Meng - 博客园 Windows 脚本 - %~dp0 的含义 - smwikipedia - 博客园 BAT 批处理 特殊符号 总结 - 白乾涛 - 博客园 利用 python 执行.bat 文件 - pathbreaker - 博客园 批处理:FOR 的参数 / D 和 / R_for dir do-CSDN 博客
731 1 分钟

# 花了两天,终于把 Python 的 setup.py 给整明白了 出处:花了两天,终于把 Python 的 setup.py 给整明白了 - 知乎 要点(哪些地方值得注意): python 用于打包的相关库的历史,比如 setuptools,distribute,distutils 等。 源代码包和二进制包的区别,以及 egg 形式和 wheel 形式的区别。 setup 函数中的若干参数,包括但不限于:classifiers,package_data,data_files,install_requires,entry_points,scripts,cmdclass 这些参数。 用...
917 1 分钟

2026 年寒假规划。规划制定原则:继往开来。 保完研后的大四上玩了相当久。看了很多的番、尝试了新的游戏、和网友组队开黑、第一次一个人去旅游(虽然是回到熟悉的深圳玩了会)、和高中朋友聚餐、第一次坐绿皮回家、和久违的球友打了几场无忧无虑的期末羽毛球,尝试做了一些以前想做但是一直没办法做的事情。虽然不及其他朋友到处旅游、聚餐、晒朋友圈如此般的生活光鲜亮丽,但我的精神已然十分幸福。 最近也发觉,寒假宅家实在是十分无聊。到网上看大家在寒假一般做什么,大多是与我类似的事情,也不全是我想象的到处聚餐旅游。所以我感觉无聊的本质上是对于寒假要做什么事情没有一个大致的规划。宅在家,打开 steam...