YM博客
  • 首页
  • 推荐
  • 标签
  • 轻览
  • 日历
优化算法中的一阶动量
优化器  
linux知道PID,怎么看进程在哪个目录运行
linux  
tf.newaxis
TensorFlow函数  
torch.triu
pytorch函数  
tf.linalg.band_part
TensorFlow函数  
Reinforcement Learning中的transition kernel
强化学习  
GEMS(Gradient Multi-Subspace Tuning)
S&R  
CODI:Continuous Chain-of-Thought via Self-Distillation
COT  
一文读懂对数函数(log函数):从定义到应用的全面解析
数学  
Think Then Embed: Generative Context Improves Multimodal Embedding
多模态   GR  
连续子数组的和大于等于给定值x的个数
编程题  
Automated Reasoning(自动推理)
Reasoning  
推荐系统中序列建模优化的思路和常见模型(DIN、DIEN等)
推荐系统   序列建模  
Memory in the Age of AI Agents: A Survey
Memory Network  
mHC(Manifold-Constrained Hyper-Connections)
deepseek   MLP  
梯度爆炸和梯度消失
梯度  
Python @ 矩阵乘法 装饰器语法
python  
FitNets: Hints for Thin Deep Nets
蒸馏  
推荐系统 | 生成式推荐
推荐系统  
FAIR: Focused Attention Is All You Need for Generative Recommendation
GR  
Diffusion Model(扩散模型)DDPM、FM、CM
深度学习  
FastAPI:一个现代、快速(高性能)的 构建API的Web 框架
框架  
HardMOE:混合专家模型(Mixture of Experts, MoE)架构中采用 **硬路由**(hard routing)策略的一种实现方式
MOE  
残差连接中的恒等映射:深度学习架构的革命性设计
深度学习中的数学  
pytorch FX图
pytorch  
PyTorch SymInt
pytorch  
DeepSpeed Ulysses —— 一种为超长序列大模型训练而设计的高效序列并行(Sequence Parallelism, SP)框架
DeepSpeed  
字节 VeOmni: Scaling Any Modality Model Training with Model-Centric Distributed Recipe Zoo
字节  
torch.compile graph break
pytorch  
Tucker 张量分解(Tucker Tensor Decomposition)
张量计算  
ERF 误差函数(Error Function):从概率到物理的奇妙桥梁
数学  
快手 ONEREC-THINK: In-Text Reasoning for Generative Recommendation
论文   快手   OneRec  
DTensorSpec 详解:分布式张量的元数据规范
分布式训练  
python dataclass frozen 不可变的数据容器类
python  
DeviceMesh:pytorch中一个用于表示设备(如 GPU)逻辑拓扑结构的核心抽象
pytorch  
DTensor 编程模型详解:原理与操作指南
分布式训练  
Tensor Parallelism(张量并行,TP)
并行策略  
FSDP(Fully Sharded Data Parallel)数据并行技术
并行策略  
RuntimeError: Triton Error [MLU]: "Device-side assert triggered
MLU Error  
深入理解 Hybrid Sharded Data Parallel(HSDP):技术细节与实现方案
并行策略  
GPU 的 TMUs(Texture Mapping Units,纹理映射单元)
GPU  
美国数学邀请赛(American Invitational Mathematics Examination,AIME)简介
数学  
016 推荐系统 | 排序学习(LTR - Learning To Rank)在推荐系统中的演进与前沿实践
推荐系统  
torch._dynamo.mark_dynamic
pytorch  
torch.compile
pytorch  
NVIDIA GEMM apex.contrib.grouped_gemm
NVIDIA   AI工程  
寒武纪(Cambricon)AI加速平台常见错误分类速查表
寒武纪  
Google Conformer: Convolution-augmented Transformer for Speech Recognition
Google  
Kubernetes Federation v2
Kubernetes  
Positional argument after keyword argument
python   常见问题  
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • …
  • 57
  • 58
  • »

如侵犯您的权益,请联系本站删除!

Copyright © 2023-2024