Toggle navigation
YM博客
首页
推荐
标签
轻览
日历
搜索
优化算法中的一阶动量
优化器
 
linux知道PID,怎么看进程在哪个目录运行
linux
 
tf.newaxis
TensorFlow函数
 
torch.triu
pytorch函数
 
tf.linalg.band_part
TensorFlow函数
 
Reinforcement Learning中的transition kernel
强化学习
 
GEMS(Gradient Multi-Subspace Tuning)
S&R
 
CODI:Continuous Chain-of-Thought via Self-Distillation
COT
 
一文读懂对数函数(log函数):从定义到应用的全面解析
数学
 
Think Then Embed: Generative Context Improves Multimodal Embedding
多模态
 
GR
 
连续子数组的和大于等于给定值x的个数
编程题
 
Automated Reasoning(自动推理)
Reasoning
 
推荐系统中序列建模优化的思路和常见模型(DIN、DIEN等)
推荐系统
 
序列建模
 
Memory in the Age of AI Agents: A Survey
Memory Network
 
mHC(Manifold-Constrained Hyper-Connections)
deepseek
 
MLP
 
梯度爆炸和梯度消失
梯度
 
Python @ 矩阵乘法 装饰器语法
python
 
FitNets: Hints for Thin Deep Nets
蒸馏
 
推荐系统 | 生成式推荐
推荐系统
 
FAIR: Focused Attention Is All You Need for Generative Recommendation
GR
 
Diffusion Model(扩散模型)DDPM、FM、CM
深度学习
 
FastAPI:一个现代、快速(高性能)的 构建API的Web 框架
框架
 
HardMOE:混合专家模型(Mixture of Experts, MoE)架构中采用 **硬路由**(hard routing)策略的一种实现方式
MOE
 
残差连接中的恒等映射:深度学习架构的革命性设计
深度学习中的数学
 
pytorch FX图
pytorch
 
PyTorch SymInt
pytorch
 
DeepSpeed Ulysses —— 一种为超长序列大模型训练而设计的高效序列并行(Sequence Parallelism, SP)框架
DeepSpeed
 
字节 VeOmni: Scaling Any Modality Model Training with Model-Centric Distributed Recipe Zoo
字节
 
torch.compile graph break
pytorch
 
Tucker 张量分解(Tucker Tensor Decomposition)
张量计算
 
ERF 误差函数(Error Function):从概率到物理的奇妙桥梁
数学
 
快手 ONEREC-THINK: In-Text Reasoning for Generative Recommendation
论文
 
快手
 
OneRec
 
DTensorSpec 详解:分布式张量的元数据规范
分布式训练
 
python dataclass frozen 不可变的数据容器类
python
 
DeviceMesh:pytorch中一个用于表示设备(如 GPU)逻辑拓扑结构的核心抽象
pytorch
 
DTensor 编程模型详解:原理与操作指南
分布式训练
 
Tensor Parallelism(张量并行,TP)
并行策略
 
FSDP(Fully Sharded Data Parallel)数据并行技术
并行策略
 
RuntimeError: Triton Error [MLU]: "Device-side assert triggered
MLU Error
 
深入理解 Hybrid Sharded Data Parallel(HSDP):技术细节与实现方案
并行策略
 
GPU 的 TMUs(Texture Mapping Units,纹理映射单元)
GPU
 
美国数学邀请赛(American Invitational Mathematics Examination,AIME)简介
数学
 
016 推荐系统 | 排序学习(LTR - Learning To Rank)在推荐系统中的演进与前沿实践
推荐系统
 
torch._dynamo.mark_dynamic
pytorch
 
torch.compile
pytorch
 
NVIDIA GEMM apex.contrib.grouped_gemm
NVIDIA
 
AI工程
 
寒武纪(Cambricon)AI加速平台常见错误分类速查表
寒武纪
 
Google Conformer: Convolution-augmented Transformer for Speech Recognition
Google
 
Kubernetes Federation v2
Kubernetes
 
Positional argument after keyword argument
python
 
常见问题
 
«
1
2
3
4
5
…
57
58
»