handsomestwei
Preview Image

机器学习项目工程实践

机器学习项目工程实践 了解机器学习项目的工程化实践,包括数据管理、模型管理、系统架构等。从第一性原理出发,理解为什么需要工程化,以及如何设计可维护、可扩展的机器学习系统。 目录 数据管理 模型管理 特征一致性保证 系统架构设计 并发控制与锁机制 错误处理与恢复 日志与监控 测试与验证 最佳实践总结 1. 数据管理 1.1 数据组织...

Preview Image

特征工程入门——从原始数据到特征矩阵

特征工程入门——从原始数据到特征矩阵 深入理解特征工程的重要性,掌握使用 Featuretools 进行自动特征生成的方法。从第一性原理出发,理解为什么需要特征工程,以及各种特征方法为什么有效。 目录 什么是特征工程? 特征工程的常见方法 Featuretools 自动特征生成 Featuretools 的工作机制 特征工程实战示例 特征工程的最佳实践...

Preview Image

特征工程常用函数详解

特征工程常用函数详解 深入理解特征工程中常用的函数(统计特征、类别特征、时间特征等),掌握每个函数的作用、含义和使用场景。从第一性原理出发,理解为什么需要这些函数,以及它们如何帮助我们提取有用信息。 目录 为什么需要特征函数? 统计特征函数 类别特征函数 时间特征函数 特征函数的组合使用 如何选择合适的特征函数? 特征函数的实际应用 1. ...

Preview Image

MLOps与机器学习生命周期管理

MLOps与机器学习生命周期管理 深入理解MLOps(机器学习运维)的概念和实践,掌握机器学习生命周期管理的完整流程。从第一性原理出发,理解为什么需要MLOps,以及如何构建可维护、可扩展的机器学习系统。了解从实验到生产的完整流程,掌握模型部署、监控和维护的最佳实践。 目录 什么是MLOps? 为什么需要MLOps? 机器学习生命周期管理 MLOps工具与实践...

Preview Image

机器学习中的数学原理基础

机器学习中的数学原理基础 深入理解机器学习中常用的数学概念(方差、标准差、协方差、相关性等),从第一性原理出发,理解这些概念的本质、作用和计算方法。理解数学是机器学习的基础,掌握这些数学原理能够帮助我们更好地理解机器学习算法。 目录 为什么需要数学原理? 描述性统计量 分布形状度量 变量关系度量 距离度量 概率基础 优化基础 线性代数基础 ...

Preview Image

机器学习项目技术选型与实践概览

机器学习任务类型、应用场景与技术选型 系统梳理机器学习的任务类型(分类、回归、聚类等)、典型应用场景(表格、文本、图像、语音),各场景下的主流技术路线,以及传统机器学习与深度学习的区别与选型依据。从第一性原理出发,理解”做什么任务、用什么数据、选什么技术”。 目录 机器学习有哪些任务类型? 任务类型与损失、评估 应用场景与主流技术 传统机器学习与深度学习的区别...

Preview Image

机器学习项目技术选型与实践概览

机器学习项目技术选型与实践概览 从第一性原理出发,帮助初学者理解机器学习项目的整体架构、技术选型思路和完整流程。 目录 引言:什么是机器学习项目 机器学习的基础原理 项目架构概览 核心技术栈介绍 技术选型思路 项目完整流程 初学者学习路径建议 1. 引言:什么是机器学习项目 1.1 从第一性原理理解机器学习 在深入技术细节之前,我们需要...

Preview Image

大模型提示词技巧-基于场景的自检清单和缺失反问

大模型提示词技巧-基于场景的自检清单和缺失反问 概述 在复杂业务场景中,大模型需要处理信息不完整的情况。通过引入自检清单机制和缺失信息处理流程,可以显著提升模型输出的准确性和可靠性。本文档介绍如何设计和使用这些技巧。 提示词功能流程 本提示词方案的核心功能流程如下: 用户提问 ↓ [场景识别] 简单场景与复杂场景自动区分 ↓ ├─→ 简单场景 → [直接回答...

Preview Image

RAG知识库多跳查询方案

RAG知识库多跳查询方案 1. 方案解决的问题 在传统的RAG(检索增强生成)知识库问答场景中,当用户提问涉及文档附件内容时,存在以下问题: 附件内容检索不精准:附件文档通常包含多个章节,在知识库中作为单个文档存储时,检索容易带出无关章节内容,影响答案准确性 附件引用信息缺失:大模型回答中虽然可能提到”详见附件X”,但无法直接展示附件具体内容,用户体验不完整 多跳查询效率...