【人工智能】deepseek R1模型在蓝耘智算平台的搭建与机器学习的探索

【人工智能】deepseek R1模型在蓝耘智算平台的搭建与机器学习的探索
在这里插入图片描述
📝个人主页🌹:Eternity._
🌹🌹期待您的关注 🌹🌹
在这里插入图片描述


在这里插入图片描述


❀ 蓝耘智算平台

前言:在人工智能技术日新月异的时代,AI 模型的不断优化创新,诞生了许多优秀的AI模型,DeepSeek就是后起之秀,DeepSeek一鸣惊人,凭借其独特的技术优势和创新特性,在AI的浩瀚星空中犹如一颗璀璨的明星,散发着耀眼的光芒。它不仅在数据处理、模式识别等方面表现出色,还具备高效的学习能力和适应性,为众多应用场景带来了革命性的变化。

接下来,我们将深入剖析 DeepSeek 的诸多优点,并详细探讨如何利用蓝耘智算平台搭建并优化我们的 DeepSeek R1 模型。蓝耘智算平台作为业界领先的高性能计算平台,为AI模型的研发与部署提供了强大的支持。通过该平台,我们可以充分利用其丰富的计算资源和高效的数据处理能力,为 DeepSeek R1 模型的训练与优化提供坚实的保障。
在搭建 DeepSeek R1 模型的过程中,我们将依托蓝耘智算平台的数据预处理、模型训练、参数调优等功能模块,确保模型能够准确捕捉数据特征,有效提升模型的准确性和泛化能力。同时,我们还将借助平台的实时监控和日志分析功能,对模型的训练过程进行全面监控和优化,以确保模型能够达到最佳性能。

总之,借助蓝耘智算平台的强大支持,我们有信心能够成功搭建并优化出性能卓越的 DeepSeek R1 模型,为人工智能技术的发展贡献一份力量。

deepseek R1简介与优点


deepseek R1简介:

DeepSeek R1是由幻方量化旗下AI公司深度求索(DeepSeek)研发的推理模型。该模型采用强化学习进行后训练,旨在提升推理能力,尤其擅长数学、代码和自然语言推理等复杂任务。DeepSeek R1于2025年1月20日正式发布,并同步开源了模型权重,采用了MIT许可协议。

deepseek R1优点:

卓越性能:DeepSeek R1在数学、代码和推理任务上表现出色,与OpenAI的模型相比毫不逊色。在AIME 2024数学竞赛中,DeepSeek R1取得了79.8%的pass@1得分,略微超过OpenAI-o1-1217。在MATH-500基准测试上,DeepSeek R1也获得了97.3%的高分,与OpenAI-o1-1217性能相当,并显著优于其他模型。在编程竞赛任务中,DeepSeek R1展示了专家级水平。在Codeforces上,它获得了2029 Elo评级,超过了该竞赛中96.3%的人类参与者。
高效训练:DeepSeek R1采用了大规模强化学习技术,仅需少量标注数据即可显著提升模型性能。这降低了对大量标注数据的依赖,提高了训练效率。该模型还构建了智能训练场,通过动态生成题目和实时验证解题过程等方式,进一步提升模型推理能力。
广泛应用场景:由于其强大的推理能力和高效性,DeepSeek R1在多个应用场景中展现出巨大潜力。例如,它可以用于个性化教学升级、AI驱动的搜索和数据分析任务等。此外,DeepSeek R1还支持中英文双语处理,进一步拓宽了其应用场景。
完全开源:DeepSeek R1完全开源,并采用了MIT许可协议。这允许用户自由使用、修改、分发和商业化该模型,包括模型权重和输出。这大大降低了AI应用门槛,赋能开源社区发展。
成本优势:与市面上其他大模型相比,DeepSeek R1在成本控制上表现尤为突出。通过优化算法和训练流程,DeepSeek R1大幅降低了训练和推理的成本。在API定价方面,DeepSeek R1也展现出极高的性价比。
多版本选择:DeepSeek R1系列已推出多个版本,包括R1-7B、R1-13B、R1-35B和R1-671B等。不同版本的模型在参数量、性能、资源消耗和应用场景等方面有所不同,为用户提供了灵活的选择。

相较于其他几款知名的AI大模型进行比较:

对比项deepseekChatGPTOpenAI o1
性能DeepSeek R1在数学、代码和自然语言推理等任务上的性能比肩OpenAI o1正式版。在AIME 2024数学竞赛中,DeepSeek R1的准确率略高于OpenAI o1。ChatGPT在性能上,一直有强大的竞争力,行业的老大哥有较为强大的性能,在整体上稍逊于deepseek
训练与成本DeepSeek R1采用了强化学习技术,在少量标注数据的情况下显著提升了推理能力,降低了对大量标注数据的依赖。计算资源需求高,部署成本相对较高输入和输出tokens的定价均高于deepseek
开源与可用性DeepSeek R1完全开源,并附带详细的技术报告,允许用户无限制商用。这为用户提供了更多的灵活性和自由度。部分新模型采取专有模式,限制开发者自由使用和深度开发OpenAI o1则未完全开源,用户在使用上可能受到一定限制。
应用场景DeepSeek R1则更专注于数学、代码和自然语言推理等复杂任务,具有更高的专业性和针对性。ChatGPT以其卓越的对话生成能力著称,适用于从日常对话到专业领域的各种场景。适用于大部分场景
实时性与响应速度DeepSeek R1则通过优化算法和训练流程,提高了推理速度和响应效率。ChatGPT在一些实时性要求高的场景中可能存在响应时间较长的问题。同样存在一定场景中耗时较长的问题

DeepSeek R1与其他AI大模型相比具有独特的优势和特点。它在数学、代码和自然语言推理等复杂任务上表现出色,同时完全开源并附带详细的技术报告,为用户提供了更多的灵活性和自由度。然而,在选择AI模型时,用户还需根据具体应用场景和需求进行综合考虑。

蓝耘智算平台


蓝耘智算平台简介


蓝耘智算平台是一个专为有高性能计算需求的用户设计的云计算平台,提供强大的计算能力和灵活的服务。该平台基于行业领先的灵活基础设施及大规模的GPU算力资源,构建了一个现代化的、基于Kubernetes的云平台,专为大规模GPU加速工作负载而设计。

在这里插入图片描述

蓝耘智算平台优势


为什么选择蓝耘智算平台来部署deepseek R1模型,让我们来深入了解一下:

丰富的算力资源:蓝耘智算平台拥有丰富且强大的GPU集群,支持多种主流GPU型号,如NVIDIA A100、V100等,能够满足不同用户对算力的多样化需求。无论是进行大规模的AI模型训练,还是处理实时推理任务,都能提供充足且稳定的算力支持。高度的开放性和灵活性:平台支持多种AI框架,如TensorFlow、PyTorch等,以及各种开发工具。用户可以根据自身的项目需求和技术偏好,自由选择适合的开发环境,实现资源的高效利用。同时,平台还提供了全流程的AI支持,涵盖了从数据预处理、模型构建、训练优化,到推理部署的每一个环节。显著的成本优势:蓝耘智算平台的速度可比传统云服务提供商快35倍,成本降低30%。这种高效且经济的特性,使得蓝耘智算平台在众多算力云服务中脱颖而出。无论是对于初创企业还是大型机构,都能为其量身定制经济高效的解决方案,帮助用户在降低算力使用成本的同时,获得卓越的计算性能。便捷的应用部署:蓝耘智算平台提供了完善的模型部署工具和服务,支持一键部署到本地或云端环境。用户只需选择相应的应用,平台会在几分钟内自动构建完整的AI应用环境,快速启动AI任务,如自然语言处理、AI作画等,大大提高开发效率。专业的技术支持:平台拥有专业的技术团队,提供7x24小时的技术支持服务。用户在使用过程中遇到的问题能够得到及时解决,从而确保项目的顺利进行。

deepseek R1模型在蓝耘智算平台的搭建


  • 首先我们访问 蓝耘智算平台 进行注册,按照注册所需内容填写即可,在注册成功后,登录平台
在这里插入图片描述
  • 在完成第一步的注册和登录之后,我们进行模型的部署
在这里插入图片描述
  • 点击进入应用市场后,映入眼帘的有两个deepseek,这里我们选择deepseek-r1_1.5b_7b_8b这个模型
在这里插入图片描述
  • 在选择好模型后点击进入,里面详细介绍了应用介绍,操作说明,与
    账号密码【 默认账号: [email protected] 密码:lanyunuser】
在这里插入图片描述
  • 了解完以上内容后,我们直接点击这个右上角的部署按钮,然后选择配置内容,我们这里选择按量付费,GPU的型号选择RTX 4090 ,显存:24GB 内存:120GB 系统盘:30GB SSD
在这里插入图片描述
  • 弹出这个窗口后,直接确定即可

  • 然后等待几分钟等待我们模型的创建,我们就可以进入deepseek R1模型的使用可视化界面了
在这里插入图片描述
  • 在完成登录之后,我们询问一下:谈谈人工智能对未来生活的影响

账号和密码我们没有设置过,就是默认密码,前文有提到过【 默认账号: [email protected] 密码:lanyunuser】输入完账号和密码我们就可以使用deepseek R1模型了

在这里插入图片描述
<details type="reasoning"done="true"duration="5"><summary>Thought for5 seconds</summary>> 嗯,用户问的是“谈谈人工智能对未来生活的影响”,看起来他们可能想了解AI在不久的未来会如何改变我们的日常生活。首先,我得回顾一下之前讨论过的人工智能和机器学习的基础,这样可以更好地展开这个话题。 >> 用户之前已经问过关于AI和ML的理解,所以这次的问题是更宏观的,关注未来的影响。这意味着我需要从多个方面入手,比如技术、经济、社会等。可能还需要涵盖正面和负面的影响,给出全面的分析。 >> 首先,我应该考虑AI带来的具体变化。比如在工作领域,自动化会不会导致大量岗位消失?还是说会创造新的职业机会?这涉及到技术进步如何影响就业结构。同时,教育和学习方式可能也会发生改变,比如个性化教学,虚拟现实教学等。 >> 除了工作和学习,日常生活中的各种服务都会被AI取代或辅助,比如智能家居、交通导航、医疗诊断等。这些建设如何影响人们的日常活动,提升生活质量。还要注意隐私和安全问题,随着AI应用扩展,这方面的问题可能会更加突出。 >> 在社会结构上,AI可能加剧不平等,比如高通消费国家与发展中国家之间的差距。此外,伦理问题也是一个重要的考量点,比如自动驾驶中的道德抉择、算法偏见等。这些都是需要深入探讨的方面。 >> 用户可能还想了解未来的技术趋势,比如强化学习和通用AI在未来几年内的发展前景,以及它们对各行各业的潜在影响。另外,政策制定者和教育机构如何应对这些变化,也是用户关心的内容。 >> 总结一下,我需要从以下几个方面展开讨论: >1. 技术进步带来的便利。 >2. 就业结构的变化及其挑战。 >3. 教育方式的革新。 >4. 日常生活中的应用与影响。 >5. 隐私、安全和伦理问题。 >6. 未来技术趋势。 >7. 政策应对与教育演进。 >> 在组织内容时,要确保逻辑清晰,层次分明,让读者能够全面理解AI对未来的多方面影响。同时,用通俗易懂的语言,避免过于专业化的术语,帮助用户更好地理解和消化这些信息。 </details> 人工智能(Artificial Intelligence, AI)作为一种革命性技术,正在深刻改变人类社会的各个方面。以下从多个角度探讨人工智能对未来生活的可能影响: --- ### 1. **技术进步与便利** - **智能化工具**:AI将通过更强大的算法和数据处理能力,提升生活中的各种工具,比如智能家居、自动驾驶汽车、个性化推荐系统等。这些工具能够以更高效、更精准的方式服务于人类。 - **自动化解决问题**:从医疗诊断到环境监测,从交通规划到资源管理,AI可以快速处理复杂数据并提供高效解决方案。 --- ### 2. **就业结构与经济转型** - **重构劳动力市场**:AI可能导致许多传统工作的消失,比如制造业、客服行业等,但也会创造新的职业机会,如AI开发人员、数据科学家等。 - **新职业兴起**:随着AI技术的普及,相关领域如机器学习工程师、自动化系统操作员等将成为主流职业。 - **全球化与本地化**:AI可能加剧全球化,但也可能促进本地化创新,尤其是在资源有限的地区。 --- ### 3. **教育与认知方式** - **个性化学习**:AI可以通过大数据分析和学习算法,为每个人量身定制最适合的学习路径,从而提高教育效率。 - **虚拟现实与增强现实**:AI结合VR/AR技术,能够为教育提供更加沉浸式、互动式的体验,提升学习效果。 - **终身学习**:AI工具可以帮助人们在任何时刻获取新知识和技能,从而满足快速变化的市场需求。 --- ### 4. **生活方式与社会结构** - **智能化家居**:通过AI驱动的智能家居系统,家庭成员可以远程控制设备、节能降低,并享受更高效率的生活。 - **公共服务优化**:AI能够优化交通规划、医疗资源分配、社会保障等公共服务,使得资源利用更加精准和高效。 - **社区自治与治理**:AI可能支持社区自主决策,比如通过数据分析来优化社区管理和事件响应。 --- ### 5. **隐私与安全** - **数据使用的扩展**:随着AI技术的普及,更多个人数据将被收集和处理,这可能引发对隐私保护的担忧。 - **网络攻击风险**:高价值的AI系统可能成为黑客攻击的目标,从而威胁到数据安全。 - **算法偏见**:AI系统可能由于训练数据中的偏见,产生不公平或错误的决策,例如在招聘、贷款等领域出现歧视。 --- ### 6. **环境与可持续发展** - **能源管理优化**:AI可以通过分析能源消耗数据,优化工业和家庭的能源使用,从而促进绿色能源的普及。 - **环境监测与预警**:利用AI技术进行大范围的环境监测,可以更快地识别污染源并制定应对措施。 - **可持续发展决策**:通过分析大量数据,AI可以帮助企业和政府做出更科学、更可持续的决策。 --- ### 7. **伦理与道德** - **人机关系的变化**:随着AI技术的普及,人类将与智能系统建立更加紧密的互动关系。这对“人性化”和人机协作的界限提出挑战。 - **决策权的分担**:在医疗、司法、金融等领域,AI系统可能参与决策过程,但如何平衡人工决策与算法决策的权重是一个重要问题。 - **道德抉择的自动化**:例如,在自动驾驶汽车面临事故选择时,必须建立明确的人类主导原则来指导AI行为。 --- ### 8. **未来技术趋势** - **通用人工智能(AGI)的出现**:这一领域仍处于研究阶段,但如果实现,AI可能具备与人类相当甚至超越的认知能力,从而对社会产生深远影响。 - **生物与AI的融合**:通过生物技术和AI的结合,可能实现更强大的智能系统,比如“脑机接口”等。 --- ### 9. **政策应对与教育演进** - **法律法规的完善**:各国需要制定相关法律来规范AI技术的应用,保护公民隐私和安全,同时促进创新。 - **人才培养**:随着AI技术的普及,高技能人才需求将大幅增加,教育体系需要相应调整,以培养更多能够应对未来挑战的人才。 --- ### 总结 人工智能无疑是21世纪最重要的技术之一,它不仅会改变工作方式和生活方式,还可能重塑人类社会的结构。在未来的发展中,如何平衡技术创新的潜力与伦理、安全等问题,是全球关注的焦点。AI带来的便利与挑战,需要人类共同努力去驾驭和引导。 

在完成简单测试后,我们再使用deepseek,对机器学习进行一下简单探索。

模型使用与机器学习的探索


机器学习:决策树算法:

  • 决策树的基本概念
决策树是一种用于分类和回归的非监督学习算法,通过分割数据集来构建树状结构,最终生成规则可用于预测目标变量。ID3算法通过迭代地选择信息增益最大的特征进行数据分割。
  • Python 实现决策树算法的步骤
定义数据结构 :将数据集表示为一个样本列表,每个样本包含特征和标签。
基-case处理 :如果没有特征或只剩下目标变量,返回单纯的叶子节点。
计算信息增益 :选择信息增益最大的特征作为分割点。
递归构建决策树 :根据选定的特征将数据集分割成左、右子集,并递归地构建左右子树。
剪枝 :为了防止过深的树,设置剪枝条件(如最小叶子节点数量或最大深度)。
测试决策树 :用训练好的模型对新数据进行预测。

以下是一个简单的Python实现:

import math defdecision_tree_train(X, Y, min_leaf=1, max_depth=None):""" 训练ID3决策树 输入: X : 特征矩阵,行为样本,列为特征 Y : 标签向量 min_leaf : 最小叶子节点数量(防止过拟合) max_depth : 最大深度(可选,如果不设置则一直递归) 输出: 决策树,形式是一个函数,可以预测标签 """deftree(root, node_idx):if node_idx ==0:return{'is_leaf':True,'value': Y[0]} left =None right =None# 获取当前节点的特征 features = X.columns[node_idx] X_left = X[X[features]==0] X_right = X[X[features]>0] Y_left =[Y[i]for i in X_left.index] Y_right =[Y[i]for i in X_right.index]# 计算信息增益 info_gain =0for f in features: all_counts ={}for row in X[X[f].notna()].index: label = Y[row] all_counts[label]= all_counts.get(label,0)+1 total =sum(all_counts.values())if total ==0:continue joint =-math.sum(math.log2(total / all_counts.get(Y[0],0))*(all_counts[Y[0]]/ total)) info_gain += joint - math.log2(total / all_counts.get(Y[0],0)) best_f =None max_ig =-1for f in features: current_ig = compute_info_gain(X, Y, f)if current_ig > max_ig: max_ig = current_ig best_f = f # 选择最佳特征进行分割if max_ig <=0andnot(math.isclose(min_leaf,len(Y_left))or math.isclose(min_leaf,len(Y_right))):return{'is_leaf':True,'value': Y[0]} split_feature = best_f threshold = X[split_feature].mean()# 递归构建左子树和右子树 left_tree = tree(root, node_idx +1) right_tree = tree(root, node_idx +2)return{'is_leaf':False,'value':None,'left': left_tree,'right': right_tree,'threshold': threshold }defcompute_info_gain(X, Y, feature):""" 计算特征的信息增益 输入: X : 特征矩阵 Y : 标签向量 feature : 需要计算的特征列名 输出: 信息增益值 """ all_values ={}for i inrange(len(X)): label = Y[i] all_values[label]= all_values.get(label,0)+1 total =sum(all_values.values())if total ==0:returnfloat('inf')# 条件概率 p = all_values[Y[0]]/ total joint =-math.log2(p) entropy =-math.sum(math.log2(count / total)for count in all_values.values()) info_gain_val = entropy - joint return info_gain_val # 训练决策树 root = decision_tree_train(X, Y, min_leaf=min_leaf, max_depth=max_depth)defpredict(tree, sample):if tree['is_leaf']:return tree['value'] features_in_tree = X.columns threshold = tree['threshold'] feature_idx = features_in_tree.index(tree['split_feature']) value = sample[feature_idx]if value < threshold:return predict(tree['left'], sample)else:return predict(tree['right'], sample)return root, predict # 示例:训练决策树并进行预测defmain():# 假设我们有以下数据集(简化的样例) X =[{'x1':0,'x2':0},{'x1':0,'x2':1},{'x1':1,'x2':0},{'x1':1,'x2':1}] Y =[0,0,1,1]# 训练决策树 root, predict = decision_tree_train(X, Y)# 测试预测print("预测结果:")for i inrange(len(X)): label = predict(root, X[i])print(f"样本{i} 预测标签为 {label}")if __name__ =="__main__": main()
  • 代码解释
decision_tree_train :这是一个函数,用来训练决策树。它接受特征矩阵X、标签向量Y、最小叶子节点数量min_leaf和最大深度max_depth。
tree :这是递归函数,用于构建单个决策树节点。如果是叶子节点,则返回一个带有标签的字典;否则,选择信息增益最大的特征进行分割,并递归构建左、右子树。
compute_info_gain :计算特征的信息增益,用于选择分割点。
predict :预测函数,使用训练好的决策树对新样本进行分类。

总结


在我们完成我们的测试之后,如果我们不再需要这个实例模型,我们可以直接关机(我这里已经关机了),然后再销毁工作空间即可

在这里插入图片描述
DeepSeek R1模型在蓝耘智算平台上的搭建与机器学习探索具有广阔的发展前景。随着人工智能技术的不断进步,DeepSeek模型的性能将进一步提升,推理速度加快,准确性更高。同时,蓝耘智算平台也将不断优化算力资源和服务,为用户提供更加高效、经济、便捷的算力支持。未来,DeepSeek R1模型将在更多领域发挥重要作用,为人们的生活和工作带来更多便利和创新。

让我们加入蓝耘智算平台,开启新的篇章!

蓝耘智算平台注册链接:https://cloud.lanyun.net//#/registerPage?promoterCode=0131

Read more

OpenClaw 远程访问配置指南:SSH 隧道与免密登录

OpenClaw 远程访问配置指南:SSH 隧道与免密登录

OpenClaw 远程访问配置指南:SSH 隧道与免密登录 本文介绍如何从 Windows 访问部署在虚拟机/远程服务器上的 OpenClaw Gateway,包括 SSH 隧道配置和免密登录设置。 目录 1. 场景说明 2. SSH 隧道访问 3. 配置免密登录 4. 创建快捷启动脚本 5. 常见问题 一、场景说明 网络架构 ┌─────────────────────┐ ┌─────────────────────┐ │ Windows 主机 │ │ 虚拟机/服务器 │ │ │ SSH 隧道 │ │ │ 浏览器 ◄───────────┼───────────────────►│ OpenClaw Gateway │ │ localhost:18790 │ 端口转发 │ 127.0.0.1:18789 │ └─────────────────────┘ └─────────────────────┘ 为什么需要 SSH 隧道? OpenClaw Gateway

By Ne0inhk

Alas碧蓝航线自动化:5分钟快速部署完整指南

Alas碧蓝航线自动化:5分钟快速部署完整指南 【免费下载链接】AzurLaneAutoScriptAzur Lane bot (CN/EN/JP/TW) 碧蓝航线脚本 | 无缝委托科研,全自动大世界 项目地址: https://gitcode.com/gh_mirrors/az/AzurLaneAutoScript Alas(AzurLaneAutoScript)是一款专为碧蓝航线设计的全功能自动化脚本,支持国服、国际服、日服和台服多服务器环境。本指南将带领新手用户从零开始,快速掌握Alas的安装配置和核心功能使用。 快速上手:5分钟部署与基础配置 环境准备与安装步骤 在开始使用Alas之前,请确保您的系统满足以下基本要求: * Windows 10/11 64位操作系统 * Python 3.8 或更高版本 * ADB调试工具(用于连接安卓模拟器) 一键安装命令: git clone https://gitcode.com/

By Ne0inhk
【Linux】一切皆文件:深入理解文件与文件IO

【Linux】一切皆文件:深入理解文件与文件IO

目录 一、理解文件 1.1、文件的概念 1.2、文件的认知 二、回顾C文件 2.1、C文件接口 2.2、实现cat 指令 2.3、stdin & stdout & stderr 三、系统文件IO 3.1、传递标志位的方法 常用的标志位: 3.2、系统调用接口 1、open——打开文件 2、close——关闭文件 3、write——写文件 4、read——读文件 3.3、文件描述符 文件描述符分配规则:

By Ne0inhk
《从内核到应用:Linux 信号的保存逻辑与捕捉过程》

《从内核到应用:Linux 信号的保存逻辑与捕捉过程》

前引:Linux 信号是进程间通信的核心机制,更是保障程序稳定性的关键 —— 当进程收到中断、终止等信号时,如何正确保存信号状态、避免丢失,又如何按预期执行处理逻辑,直接决定了程序的可靠性。本文将从内核底层逻辑出发,拆解信号保存的核心机制,结合实际代码案例,带你掌握 Linux 信号处理的完整流程与实操技巧! 目录 【一】信号的保存 (1)信号在内核的保存 (2)信号集 (3)信号集操作 (1)sigemptyset() (2)sigfillset() (3)sigaddset() (4)sigdelset() (5)sigismember() (6)sigprocmask() 函数使用总结: 【二】二谈进程地址空间 【三】内核|用户态的切换 【四】信号的捕捉过程 (1)sigaction() (2)信号自动屏蔽 (3)

By Ne0inhk