Qwen3.6越狱版火了

Qwen3.6越狱版火了

AI芯片神经网络示意图
图源:AI生成示意

2026年5月下旬,一款名为 Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive 的模型在开源社区迅速走红,被称为"越狱版"Qwen3.6。

这个版本移除了官方模型的内容审查限制,同时保留了完整的推理和代码能力。对于本地部署玩家来说,这意味着真正的"模型自由"。

核心数据对比

模型 参数量 激活参数 显存门槛 开源/收费 特点
Qwen3.6-35B-A3B Uncensored 35B 3B 6G 开源 无审查、支持视觉
Qwen3.6 官方版 35B 3B 6G 开源 有内容审核
GPT-5.5(闭源参考) 未公开 未公开 API only 收费 原生Agent能力
Llama 4 Ultra 约400B 约50B 24G+ 开源 多模态强化

MoE架构:35B参数,6G显存可跑

这个模型的核心优势是 MoE(混合专家)架构

总参数35B,但每次推理只激活约3B参数。计算量大幅降低,显存占用约等于一个7B模型。

实测RTX 4060 Laptop(8G显存)跑IQ2_M量化版本,输出速度约10 tokens/s。用llama.cpp原生引擎,配--jinja参数,中文输出稳定。

无审查的意义

"越狱"在这里指移除模型的安全对齐限制。

官方版遇到某些提示词会拒绝回答。这个版本直接输出,不做内容审核。适合本地研究、安全测试、以及需要模型"说实话"的场景。

值得强调的是,这个版本的能力没有打折。实测代码生成、多模态识图、长文本推理都保持高水准。

视觉能力

模型支持多模态,需要额外下载mmproj文件。启动llama-server时挂载该文件,即可支持图片分析、OCR、截图问答。

如何使用

  1. 下载llama.cpp(根据显卡选CUDA版本)
  2. 下载对应量化版本的GGUF模型文件
  3. 双击run.bat,浏览器打开http://127.0.0.1:8080
  4. 支持OpenAI API格式,可接入OpenWebUI、Cherry Studio等工具

显存对照:6-8G用IQ2_M,12-16G用IQ4_NL(推荐),24G以上用Q4_K_P。

模型链接

  • HuggingFace:https://huggingface.co/HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive[1]
  • GitHub Qwen3.6官方:https://github.com/QwenLM/Qwen3.6[2]
  • llama.cpp项目:https://github.com/ggerganov/llama.cpp[3]

本文涉及模型仅用于本地研究和安全测试,请勿用于非法用途。

发表评论