本文分类:news发布日期:2025/4/20 6:53:12
相关文章
【RL系列】StepFun之Open-Reasoner-Zero
1. 简介
开源了一个大规模RL训练框架之Open-Reasoner-Zero,仅使用vanilla PPO,GAE中参数 λ 1 , γ 1 \lambda 1, \gamma 1 λ1,γ1,rule-based reward,不需要KL regularization就可以增加response length和benchmark上的指标。…
建站知识
2025/4/10 14:23:19
ubuntu20.04.6LTS 安装PCL 1.9.1
在虚拟机中,ubuntu20.04.6 LTS 安装PCL 1.9.1,实测成功了。
注意:
1、编译时选择双核,否则编译到一半报错,因为内存不够进程被杀死。 虚拟机是4核心、内存8G。可能选3核更快一点,双核编译了2个多小时。
…
建站知识
2025/4/10 14:21:17
k8s部署grafana
先决条件
这里部署过程的前提是已经部署好storageclass,所以pv会根据pvc自动创建.
详情参考:k8s-StoargClass的使用-基于nfs_a volume that contains injected data from multiple-CSDN博客
直接开始:
部署pvc
[rootmodule /zpf/grafana]$cat pvc.yml
apiVersion: v1
kind…
建站知识
2025/4/10 14:15:07
使用 `pandas` 库来读取 Excel 文件,并实现六种算法的遍历计算
以下是一个满足你需求的 Python 程序示例。在这个示例中,我们假设已经有了处理数据的函数,并且生成的 Excel 文件中包含了观测数据和推算数据。我们将使用 pandas 库来读取 Excel 文件,并实现六种算法的遍历计算。
import pandas as pd# 模拟…
建站知识
2025/4/18 16:24:08
LLM应用实战1-基本概念
文章目录 基本概念1. 提示词工程(Prompt Engineering)2. AI Agent(智能代理)3. Model Context Protocol (MCP)4. Function Calling(函数调用)5. Retrieval-Augmented Generation (RAG)6. FineTuning&#x…
建站知识
2025/4/10 14:13:04
Vue3中watch监视reactive对象方法详解
在Vue3中,使用watch监视reactive对象时,需根据监视的目标选择合适的方法。以下是详细的步骤和说明:
1. 监视整个reactive对象 自动深度监视:直接监视reactive对象时,Vue3会默认启用深度监视,无需设置deep:…
建站知识
2025/4/10 14:11:01
【HarmonyOS Next之旅】DevEco Studio使用指南(十一)
目录
1 -> 代码实时检查
2 -> 代码快速修复
3 -> C快速修复使用演示
3.1 -> 填充switch语句
3.2 -> 使用auto替换类型
3.3 -> 用?:三元操作符替换if-else
3.4 -> 从使用处生成构造函数
3.5 -> 将变量拆分为声明和赋值 1…
建站知识
2025/4/10 14:09:59
2025.4.9总结
今天周三,晚上默认不加班,每到闲暇的时候,总会瞎想。
如今想想,是要多提升提升自身的软实力了。硬实力,是你的专业技能,是你吃饭的东西,而软实力则体现在人际交往,表达能力等方面。…
建站知识
2025/4/10 14:06:55