# sikong **Repository Path**: open-project-yhp/sikong ## Basic Information - **Project Name**: sikong - **Description**: 开源建筑行业大模型 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: develop - **Homepage**: https://github.com/SikongSphere/sikong.git - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 7 - **Created**: 2024-08-05 - **Last Updated**: 2024-08-05 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README [**中文**](./README.md) | [**English**](./README.en.md) # 司空:基于中文建筑行业知识的LLaMA和Alpaca微调大模型 ### SiKong:Tuning LLaMA and Alpaca Model With Chinese Architecture Instructions
[](LICENSE) 
其中具体的训练细节已经上传至`wandb`,通过点击[此处](https://api.wandb.ai/links/sikongsphere/tws3k5em)查看训练详情。
### 7.1. 计算资源需求
`sikong`训练资源:
- `GPU`: `A100-PCIE-40GB` * 4卡
- `CPU`: `40 vCPU Intel Xeon Processor (Skylake, IBRS)`
- `内存` 288GB
### 7.2. 实验过程
## 8. 模型效果对比
为了展示司空语言大模型的能力,我们展示如下几组测试。
### 8.1 问题一
- 测试输入:
- **请介绍一下变形缝的概念。**
- Llama输出:
- 变形缝是一种可以改变形状的缝。
- Alpaca输出:
- 变形缝是一种特殊的缝合技术,它可以将两个物体结合在一起,而不需要使用任何粘合剂。
- ChatGLM输出:
- 变形缝通常由混凝土或砖石等建筑材料制成,其目的是在地震或自然灾害时,使岩石形成隔离缝,防止相邻的岩石受到更大的破坏。
- SiKong司空输出:
- 变形缝是指将建筑物垂直分开的预留缝。由于温度变化、地基不均匀沉降和地震因素的影响,易使建筑物发生裂缝或破坏,故在设计时应事先将房屋划分成若干个独立的部分,使各部分能自由地变化。
### 8.2 问题二
- 测试输入:
- **图书馆中书架之间以及书架与墙体之间通道的最小宽度是多少?**
- Llama输出:
- 1.5m
- Alpaca输出:
- 书架之间通道的最小宽度是0.5厘米,书架与墙体之间通道的最小宽度是0.5厘米。
- ChatGLM输出:
- 图书馆中书架之间以及书架与墙体之间通道的最小宽度取决于不同国家和地区的法规和规定。一般来说,图书馆的书架通道应该保证书籍的流通和检索,因此最小宽度应该能够容纳一个人的步行距离。
- SiKong司空输出:
- 按照《图书馆建筑设计规范》(JGJ 38-2015)中规定,图书馆中书架之间以及书架与墙体之间通道的最小宽度按通道类型划分为以下几种情况:
1. 主通道中,开架的常用书架间隔不小于1.5m,闭架的常用书架间隔不小于1.2m,不常用书架间隔不小于1m;
2. 次通道中,开架的常用书架间隔不小于1.1m,闭架的常用书架间隔不小于0.75m,不常用书架间隔不小于0.6m;
3. 档头走道(即靠墙走道)中,开架的常用书架间隔不小于0.7m,闭架的常用书架间隔不小于0.6m,不常用书架间隔不小于0.6m;
4. 行道中,开架的常用书架间隔不小于1m,闭架的常用书架间隔不小于0.75m,不常用书架间隔不小于0.6m。
### 8.3 问题三
- 测试输入:
- **在中国建筑设计防火规范中,重要公共建筑是什么?**
- Llama输出:
- “重要公共建筑”指在中国建造的具有特殊社会功能、影响面广、对社会和经济发展有显著作用的建筑。
- Alpaca输出:
- 在中国建筑设计防火规范中,重要公共建筑是指一类公共建筑,包括医院、学校、博物馆、图书馆、商场、政治机关、金融机构等,这些建筑的使用功能复杂,人员密集,且具有较高的火灾危险。
- ChatGLM输出:
- 在中国建筑设计防火规范中,重要公共建筑是指一类公共建筑,包括医院、学校、博物馆、图书馆、商场、政治机关、金融机构等,这些建筑的使用功能复杂,人员密集,且具有较高的火灾危险。
- SiKong司空输出:
- 在《建筑设计防火规范》中,重要公共建筑是指发生火灾可能造成重大人员伤亡、财产损失和严重社会影响的公共建筑。
## 9. 常见问题
1. Q:为什么在输入后出现模型自问自答的情况?
A:若出现这种情况,请对输入句末尾添加`##`并再次输入。
2. Q:为什么叫做SiKong(司空)
A:因为司空是中国古代的一种官职,主要负责国家的城市建设和水利枢纽建设,同样也是司空学社的命名由来。本大模型采用司空这种称号,其实也是希望能够秉承中国建筑行业的传统。
3. Q:执行`sh`文件时出现`/bin/bash^M: bad interpreter: No such file or directory`的报错该怎么处理?
A:在`Linux`平台上执行`sed -i "s/\r//" xxx.sh`,再重新运行。其中,`xxx.sh`表示对应的文件。
4. Q:训练数据主要包括哪些?
A:`sikong`所涉及的训练数据主要包括`《中国建筑设计防火规范》`、`《建筑概论》`等标准文件。
## 10. 项目参与者
本项目由司空学社的刘钧文、梁超、王屹卓、孙艺玮、董广龙、李英汉、贾一丁、王浩程、侯占民、何伊雯、武晋、马英等完成。
## 11. Star History
[](https://star-history.com/#SikongSphere/sikong&Date)
## 12. 致谢
- 感谢王非先生、路明女士对本项目的资金支持。
- 本项目使用了[LMFlow](https://github.com/OptimalScale/LMFlow.git) 与 [Chinese-LLaMA-Alpaca](https://github.com/ymcui/Chinese-LLaMA-Alpaca.git) 仓库,在此致谢!
## 13. 免责声明
本项目相关资源仅供学术研究之用,严禁用于商业用途。使用涉及第三方代码的部分时,请严格遵循相应的开源协议。模型生成的内容受模型计算、随机性和量化精度损失等因素影响,本项目无法对其准确性作出保证。本项目数据集绝大部分由模型生成,即使符合某些建筑学事实,也不能被用作实际建筑设计的依据。对于模型输出的任何内容,本项目不承担任何法律责任,亦不对因使用相关资源和输出结果而可能产生的任何损失承担责任。
## 14. Citation
如果你使用了本项目的数据或者代码,请声明引用
## 15. 合作单位