置顶文章
Python初学者练手小项目集
# 水仙花数 水仙花数,即一个三位数,其各位数字的立方和等于该数本身。例如:153 = 1^3 + 5^3 + 3^3。找出所有的水仙花数并打印出来。 def ques1(): for i in range(1, 1000): num = i sum_of_cubes = 0 while num > 0: digit = num % 10 sum_of_cubes += digit ** 3 num //= 10 if sum_of_cubes == i: print(f"{i}是一个水仙花数。")if __name__ ==...
more...用self-instruct方法合成数据并微调法律大模型
# 生成微调数据 # 准备工作 DISC-LawLLM 主要基于 DISC-Law-SFT-Pair 和 DISC-Law-SFT-Triplet 数据集进行训练,这两个数据集对应了法律专业人员助手、法律咨询服务、法律考试助手、法律专业人员助手和法律咨询服务的情景。 这次实践,使用 Self-Instruct 方法,利用 DISC-Law-SFT-Pair 和 DISC-Law-SFT-Triplet 数据集生成微调数据,以此微调 DISC-LawLLM。Self-Instruct 方法是怎么工作的?如下图: seed tasks 是源数据,Self-Instruct...
more...精选分类
人工智能
保研
读书
计算机
琐碎
项目与实践
学术
文章列表
从中学生租房自立的普遍现象探讨年轻人自立
# 现象 之前就注意到,有不少还在上中学的学生选择离开父母到外面租房自立。我觉得有如下情境: 与家庭父母闹矛盾,发现自己与家人越发难以相处,遂选择避开父母单居。 较为有远见的父母,建议孩子到外面单居独立生活。 结合自己亲身经历,以及许多所见所闻,我发现前者大多发生在经济条件不好的家庭中,后者则发生在经济条件较好的家庭中。 在前者的情境下,家庭父母的态度更倾向于批评孩子、精神打压孩子。相反,如果在这种情境下的父母态度倾向于宠溺孩子,那么更有可能的是这个孩子选择闭门不外出以此来达到 “反击”...
more...Python 处理 HTML 全面学习指南(中文)
适用人群:零基础到进阶开发者 目标:系统掌握 Python 处理 HTML 的解析、清洗、提取、生成与自动化等实战能力。 # 目录 目录 简介与环境准备 安装 版本选择建议 验证安装 核心概念 常用方法速查(入门必会) 第一个 HTML 解析程序 —— 提取标题与段落 HTML 解析基础 BeautifulSoup 核心对象 常见选择器 标签与属性操作 文本清洗与规范化 选择器进阶 CSS 选择器 XPath(lxml) 正则与选择器结合 网页抓取与编码 requests 基础用法 编码检测与修复 反爬与礼貌策略 表格与列表数据提取 HTML...
more...wxPython 全面学习指南(中文)
适用人群:零基础到进阶开发者 目标:系统掌握 wxPython 的核心概念、布局、事件、绘图、多线程、数据绑定、打包发布等实战能力。 # 目录 目录 简介与环境准备 安装 版本选择建议 虚拟环境(推荐) 验证安装 基本概念 常用方法速查(入门必会) 第一个 wxPython 程序 带布局与事件的完整最小例子 应用结构与主循环 生命周期要点 最佳实践 App/Frame 常用方法 常用控件速览 控件常用方法(通用) StaticText 使用指南 TextCtrl 常用样式 TextCtrl 常用方法 常用辅助控件 布局管理(Sizer) 常见 Sizer BoxSizer...
more...英博云使用简要
[TOC] # 基本关系 集群下管理着多个开发机,开发机是用户使用计算资源的基本单位。每个集群有自己的共享存储卷、块存储卷以及对象存储卷。不同集群的存储不共享。 共享存储卷一般存放数据集之类的大型训练数据,可挂载到多个开发机,块存储一般只挂载到一个开发机。对象存储主要是存海量非结构化数据,如图片、音频、视频、文本等。 # 开发机使用 介绍两种常用的使用方式。方式一,开机后使用开发机自带的 Jupyter,即点击 JupyterLab。在 JupyterLab 里可以通过这个按钮上传文件: 然后红框左边的按钮是创建新的目录,红框右边是刷新,蓝色加号是打开新的 Jupyter 页面。 方式二,用...
more...Conda、Pip、Cuda
# 更改 conda 的环境存放位置 我在使用服务器进行开发时,发现服务器的 conda 环境装在 root 根目录下,而根目录只有 30G。随着虚拟环境越来越多,30G 是根本不够用的。 进入根目录下的 conda 目录(通常叫 miniconda3 或者 anaconda3),在该级目录下找到 .condarc 这个文件,添加如下内容: envs_dirs: - /data/envs/data/envs 是你自定义的存放虚拟环境的位置。保存后,以后创建虚拟环境就能自动在这个目录下创建了。同时,你可以把虚拟环境 env...
more...huggingface使用指南
# 通过 huggingface_cli 下载模型和数据集 除了直接到网页端点击下载按钮之外,还可以在终端用命令行的方式下载数据集和模型。 首先应该安装 huggingface_hub 工具: pip install -U huggingface_hubhuggingface-cli 已经弃用,huggingface-cli 已经更新为 hf 命令。关于 hf 命令有哪些变化,可以考虑学习这篇文章:https://zhuanlan.zhihu.com/p/663712983?s_r=0。 在 Windows,你可以依次执行: $env:HF_ENDPOINT =...
more...做一个像朋友圈一样的生活相册集
# 关键参考资料与图床选择 一篇就够了的超详细资料:https://www.cnblogs.com/PeterJXL/p/18288686 ,这个是将七牛云作为对象存储,也就是图床。如果也打算用七牛云存储,那么跟着这一篇做就完全可以了。 我选择七牛云主要是它的标准存储提供 10GB 的免费额度,也有一定的免费上下行流量额度,适合学生党、个人这种轻量的需求。 然后我向朋友取经,他推荐把 Telegram 作为图床,而且图片都支持引出外链,这个说不定也可以作为替代方案。我打算将来 10GB...
more...











