本文分类:news发布日期:2025/4/19 14:34:28
相关文章
笔记本电脑本地部署ollama大模型(显存不足调用CUDA Unified Memory方法)
软硬件:win11,NVIDIA GeForce RTX 3050 显存4g
一.ollama模型最低要求
1. Llama 3.1 (8B) 模型
GPU: 至少需要 1 张具有 16 GB 显存的 GPU(例如 NVIDIA Tesla V100 或 A100)。CPU: 高性能的多核处理器(例如 Intel Xeon 或 AMD …
建站知识
2025/3/13 3:41:48
【C++】命名空间的作用
命名空间的作用 引言1、命名空间基础1.1为什么需要命名空间1.2 基本语法 2、名称解析机制2.1 查找顺序规则2.2 限定与展开 3、高级特性解析3.1 内联命名空间(C11)3.2 匿名命名空间3.3 命名空间别名 4、工程实践指南4.1 最佳实践原则4.2 常见陷阱 总结 引…
建站知识
2025/3/13 3:43:46
英码科技携昇腾DeepSeek大模型一体机亮相第三届北京人工智能产业创新发展大会
2025年2月28日,第三届北京人工智能产业创新发展大会在国家会议中心隆重开幕。本届大会以"好用、易用、愿用——以突破性创新加速AI赋能千行百业”为主题,重点展示人工智能技术创新成果与产业化应用实践。作为昇腾生态的APN伙伴,英码科技…
建站知识
2025/3/13 3:43:18
神经网络 - 激活函数(Swish函数、GELU函数)
一、Swish 函数
Swish 函数是一种较新的激活函数,由 Ramachandran 等人在 2017 年提出,其数学表达式通常为 其中 σ(x) 是 Sigmoid 函数(Logistic 函数)。
如何理解 Swish 函数 自门控特性 Swish 函数可以看作是对输入 x 进行“…
建站知识
2025/4/14 17:34:55
卷积神经网络梯度下降方向与参数更新方向的一致性论述
梯度下降是一种常用的优化算法,用于最小化损失函数,在机器学习和深度学习领域有着广泛的应用。分别对梯度下降、梯度方向以及参数更新采用负梯度方向的原因进行论述。
1.梯度下降 它的基本思想是通过迭代的方式来更新模型的参数,使得损失函数…
建站知识
2025/4/14 13:02:13
数据结构:二叉树的链式结构及相关算法详解
目录 一.链式结构的实现
1.二叉树结点基本结构,初始化与销毁:
二.链式结构二叉树的几种遍历算法
1.几种算法的简单区分:
2.前序遍历:
3.中序遍历:
4.后序遍历:
5.层序遍历(广度优先遍历B…
建站知识
2025/4/19 10:55:15
LLM大型语言模型(一)
1. 什么是 LLM?
LLM(大型语言模型)是一种神经网络,专门用于理解、生成并对人类文本作出响应。这些模型是深度神经网络,通常训练于海量文本数据上,有时甚至覆盖了整个互联网的公开文本。
LLM 中的 “大” …
建站知识
2025/4/2 11:33:56