置顶文章

16k 15 分钟

# 生成微调数据 # 准备工作 DISC-LawLLM 主要基于 DISC-Law-SFT-Pair 和 DISC-Law-SFT-Triplet 数据集进行训练,这两个数据集对应了法律专业人员助手、法律咨询服务、法律考试助手、法律专业人员助手和法律咨询服务的情景。 这次实践,使用 Self-Instruct 方法,利用 DISC-Law-SFT-Pair 和 DISC-Law-SFT-Triplet 数据集生成微调数据,以此微调 DISC-LawLLM。Self-Instruct 方法是怎么工作的?如下图: seed tasks 是源数据,Self-Instruct...
878 1 分钟

# 通过 huggingface_cli 下载模型和数据集 除了直接到网页端点击下载按钮之外,还可以在终端用命令行的方式下载数据集和模型。 首先应该安装 huggingface_hub 工具: pip install -U huggingface_hubhuggingface-cli 已经弃用,huggingface-cli 已经更新为 hf 命令。关于 hf 命令有哪些变化,可以考虑学习这篇文章:https://zhuanlan.zhihu.com/p/663712983?s_r=0。 在 Windows,你可以依次执行: $env:HF_ENDPOINT =...
1k 1 分钟

# 关键参考资料与图床选择 一篇就够了的超详细资料:https://www.cnblogs.com/PeterJXL/p/18288686 ,这个是将七牛云作为对象存储,也就是图床。如果也打算用七牛云存储,那么跟着这一篇做就完全可以了。 我选择七牛云主要是它的标准存储提供 10GB 的免费额度,也有一定的免费上下行流量额度,适合学生党、个人这种轻量的需求。 然后我向朋友取经,他推荐把 Telegram 作为图床,而且图片都支持引出外链,这个说不定也可以作为替代方案。我打算将来 10GB...
219 1 分钟

在多个平台输出的内容类型和定位如下 文字性、知识输出性质:知乎、博客园、公众号。主要做 AI 领域相关,是主要的 IP 阵地之一,主要走知识付费道路。其中,知乎、博客园涉及范围更大,适合硬核长文,公众号适合短文。 视频性质:抖音、视频号。是主要的 IP 阵地之一,主要走 AIGC 工具道路。 壁纸、AIGC、头像等电子虚拟商品:小红书。是主要的 IP 阵地之一,主要走 AIGC 工具道路。 游戏、二次元、娱乐性质:BiliBili。目前定位为纯娱乐,以原创视频为主。

精选分类

文章列表

1.5k 1 分钟

最近在玩 p5r,以及逛一些论坛社区的帖子,再结合自己脑中闪过的灵感,突然对团队协作,以及个人价值,他人价值,价值间的交互有所思考。 先看一段在知乎上的文字: 『中国式教育是筛选,而不是培养』,筛选的是极端个人主义,利益主义,贬低、迫害团队精神的人。因为只有这样的筛选,才能让每一个所谓的被筛选出来的 “精英” 养成偷偷摸摸内卷,孤军奋战的习惯,打心眼里厌恶团队协作,这样在未来,当他面对已经成型、规模化的巨头时,根本没有团结力量与之对抗的能力,最大的造化就是作为一颗螺丝,燃烧自己的全部给巨头卖力。 这段文字让我若有所思,因为我在保研的过程以及身边也看到过很多这种社会筛选出来的...
4.9k 4 分钟

题目顺序与难度无关,觉得太难可以看下一道题。 无需多言,直接上代码。 from random import *def ques1(): # 猜拳游戏,包含普通模式、困难模式和简单模式,玩家可选择模式进行游戏,并统计总局数和玩家获胜局数,玩家可随时退出游戏,程序结束时显示统计结果。 # 普通模式:电脑随机出拳。 # 困难模式:电脑有 80% 的概率出能赢玩家的拳。 # 简单模式:电脑有 70% 的概率出能输给玩家的拳。 # 游戏规则:剪刀(0)胜布(2),布(2)胜石头(1),石头(1)胜剪刀(0)。 # 电脑出拳策略根据玩家选择的模式进行调整。 total_game = 0...
3.2k 3 分钟

[TOC] # 基本关系 集群下管理着多个开发机,开发机是用户使用计算资源的基本单位。每个集群有自己的共享存储卷、块存储卷以及对象存储卷。不同集群的存储不共享。 共享存储卷一般存放数据集之类的大型训练数据,可挂载到多个开发机,块存储一般只挂载到一个开发机。对象存储主要是存海量非结构化数据,如图片、音频、视频、文本等。 # 开发机使用 介绍两种常用的使用方式。方式一,开机后使用开发机自带的 Jupyter,即点击 JupyterLab。在 JupyterLab 里可以通过这个按钮上传文件: 然后红框左边的按钮是创建新的目录,红框右边是刷新,蓝色加号是打开新的 Jupyter 页面。 方式二,用...
867 1 分钟

# 更改 conda 的环境存放位置 我在使用服务器进行开发时,发现服务器的 conda 环境装在 root 根目录下,而根目录只有 30G。随着虚拟环境越来越多,30G 是根本不够用的。 进入根目录下的 conda 目录(通常叫 miniconda3 或者 anaconda3),在该级目录下找到 .condarc 这个文件,添加如下内容: envs_dirs: - /data/envs/data/envs 是你自定义的存放虚拟环境的位置。保存后,以后创建虚拟环境就能自动在这个目录下创建了。同时,你可以把虚拟环境 env...
22k 20 分钟

# 编译原理理论 参考教材:清华大学《编译原理》第三版。 另参考:本人的编译原理老师的授课内容。 如有错误,欢迎指正。 目的:梳理编译原理课程的核心知识,另一方面为了更好地备考期末。 形式:目录罗列知识结构、问答题强化知识、信息栏回忆知识。 每次我将这些知识总结、整理到博客上时,内心都很满足和愉悦。 # 概论 #...
129 1 分钟

# 网页部署 布置静态网页,启蒙介绍:https://blog.csdn.net/abjtxf/article/details/145431226 同上,相较更详细一些的启蒙介绍:https://lxnchan.cn/cfworkers-webpages.html
7k 6 分钟

# 《认知觉醒:开启自我改变的原动力》 周岭 # 第一章 大脑 —— 一切问题的起源 为了适应陆地生活,爬行动物演化出了最初的 “本能脑”。本能脑的结构很简单,只有一个原始的反射模块,可以让爬行动物对环境快速做出本能反应,比如遇到危险就战斗或逃跑,遇到猎物就捕食,遇到心仪的异性就追求等。 哺乳动物的大脑里也发展出一个独特的情感区域(边缘系统),脑科学家称之为 “情绪脑” 人类沉迷于自己独有的理智,所以把这个新的脑区称为 “理智脑” 本能脑已经有近 3.6 亿年的历史,情绪脑有近 2 亿年的历史,而理智脑出现的时间只有 250...
347 1 分钟

# 小波变换 十分易懂的关于小波变换的介绍,可以形成初步的感性上的认知:https://zhuanlan.zhihu.com/p/22450818 这一篇在第一篇的基础上,深入了更多的内容:https://blog.csdn.net/qq_41990294/article/details/114238515 Summary 小波变换的完全展开由母小波(波函数 wavelet function )和父小波(尺度函数 scale function )定义,wavelet function 等同于对信号做高通滤波保留变化细节,而 scaling function...
186 1 分钟

学习自白斌老师的谈判实用技巧。 移花接木:若对方的要求十分难以接受,当面拒绝不合适时,可以首先进行同意,然后再提出一个让对方难以接受的条件进行拒绝。“送我宝马”“可以,但有个条件,我要让你送我一栋别墅”。 降低对方期待值:如果对方想要让你接受一个比较坏的结果,你可以告知他接受该结果后的一个更坏的局面。反之亦然,让对方接受一个东西,若对方不接受,则告知将会面临一个更大的后果。