递归火山软件开发平台

标题: 纯源码基于c++ 和qt界面本地电脑部署及永久免费使用AI大.... [打印本页]

作者: ok2021 时间: 2026-3-22 13:41
标题: 纯源码基于c++ 和qt界面本地电脑部署及永久免费使用AI大....
夸克网盘
pan点quark点cn/s/60121f2045ca(因为限制自行把点替换.)
纯源码基于c++ 和qt界面本地电脑部署大模型
**4GB 显存/内存环境完美运行**：

与本地电脑部署大模型通信的 3 种真实方式（本项目采用方法2 内存映射断网也可使用无需任何费用无限使用）
1. 标准输入输出流（stdin/stdout）→ 最原生、最高效
不联网、不走 HTTP、直接进程间管道通信。
工作方式：
- 启动一个模型推理程序（ main.exe , llama.cpp ）
- 外部程序通过子进程管道往它的 stdin 发问题
- 模型把生成的文字逐 token 写到 stdout
- 外部程序实时读 stdout 流式输出

2. 共享内存 / 内存映射（高级用法）
- 模型加载到内存
- 其他进程直接读写内存区域
- 速度极快，但平台绑定强、复杂
- 一般用于 C/C++ 嵌入，

3. HTTP / WebSocket（最通用）
就是 Ollama、vLLM、llama.cpp server 那种。
把流包装成 HTTP JSON 或 SSE 流。

因为推理参数很难调导致回复有很多缺点例如循环问题等特殊符号问题等详细见llamaworker.cpp 问了很多ai辅助也没调试好有经验的自行修改llamaworker.cpp（或使用ai辅助）有大佬能帮完善发来一份最好了以下是llamaworker.cpp源码中推理参数

核心功能：
- 重复检测机制，避免生成重复内容
- 高级采样策略（温度采样 + Top-k + Top-p）
- 合理的生成参数设置
- 默认参数：

- 温度：0.7
- Top-k：40
- Top-p：0.9
- 重复惩罚：1.1
- 生成 token 数量：512

作者: ok2021 时间: 2026-3-22 16:54
重要补充（否则构建项目失败）
d盘新建文件夹TraeTemp
把整个MyGGUFv2文件夹拖出到电脑d盘TraeTemp文件夹下即可模型静态库已在源码使用绝对路径 f需要放其它磁盘的自己修改源码

作者: 4463424 时间: 2026-3-22 17:51
看上去很高级！

作者: 唐兀 时间: 2026-3-23 10:02
有没有火山GO上的方式呢

作者: ok2021 时间: 2026-3-23 12:14

唐兀发表于 2026-3-23 10:02
有没有火山GO上的方式呢

其实理解大模型如何被外部程序调用原理你自己应该会写程序无论什么语言都有变通的方法（道理懂了可以指挥AI帮你写）
“大模型如何被外部程序调用”，大致可以归纳如下
1模型文件 = 参数（数字）+ 结构描述（或代码）
2加载 = 在 GPU/CPU 内存中实例化模型结构并填入参数
3推理 = 输入 token 序列，利用参数执行前向计算，输出下一个 token（或完整响应）
4通信 = 外部程序通过进程内函数调用或网络 API（HTTP/gRPC）将输入传递给模型进程，并接收结果

下面详细解释一下
加载 = 在 GPU/CPU 内存中实例化模型结构并填入参数
例如llama.cpp 读取 GGUF 模型文件，解析元数据确定网络结构，分配内存，加载张量，然后即可用llama.cpp 代码中内置的推理函数执行。
通过加载模型实例化模型结构后会得到结构体指针（Python 对象的概念，逻辑类似实例化对象）。结构体指针就是模型在内存中的运行时表示，它的主要作用是封装参数和计算逻辑，对外提供统一的推理接口。不同框架/库的实现方式略有不同，但本质相似：

例如在 llama.cpp 中
llama.cpp 是 C++ 实现，没有 Python 对象的概念，但逻辑类似：
加载 GGUF模型文件后，你会得到一个 llama_model 结构体指针和一个 llama_context 结构体指针。
它们可以看作是“对象”的 C 语言版本。
llama_model：包含模型的所有参数（权重）、结构元数据（层数、头数等）。
llama_context：包含推理时的运行时状态（如 KV 缓存、当前上下文长度等）。
这些“对象”有什么用？
调用 llama_decode() 或 llama_eval() 时，需要传入 llama_context，它会使用 llama_model 中的参数执行计算。
管理推理状态：比如维护 KV 缓存，记录已处理的 token 数量，支持多轮对话等。
提供采样接口：llama_sample_top_p 等函数基于当前 logits 选择下一个 token。

欢迎光临递归火山软件开发平台 (https://bbs.voldp.com/)