代码与生活

Ek Jindri Meri

Home Archives
2026
3月 10

白嫖 AWS ECR / Aliyun 镜像源托管公开镜像

3月 10

使用 TheRock + HIP 和 rocperf 的一些情报

« 上一页12

分类

  • AMD
  • Deep Learning
    • System
  • GPU Programming
    • Compiler Optimization
  • GPU计算
    • ROCm
  • Infrastructure
  • 嵌入式
  • 技术分享
  • 系统优化
  • 系统研究
  • 系统编程
    • GPU 编译器
  • 编译器
    • HPC
  • 网络
  • 运维

标签

  • ACR
  • AI for Code
  • AMD
  • AMD RDNA3
  • AWS
  • Aliyun
  • Benchmark
  • CPU
  • CUDA
  • Compiler
  • DeepEP
  • DeepSeek
  • Docker
  • ECR
  • ESXi
  • Embedded
  • FlashAttention
  • GPU
  • H20
  • HAMi
  • HomeLab
  • IPv6
  • JupyterHub
  • K3s
  • Kubernetes
  • LLM
  • LLVM
  • LuckFox
  • MI50
  • NCCL
  • OpenClash
  • OpenWrt
  • Profiling
  • PyTorch
  • ROCm
  • RV1103
  • RX580
  • Register Pressure
  • Rust
  • Ryzen AI
  • SQLCipher
  • SQLite
  • Security
  • Triton
  • compiler
  • inference
  • ucode
  • vLLM
  • 上海科技大学
  • 强化学习
  • 性能分析
  • 指令调度
  • 校园网
  • 测试报告
  • 缓存优化
  • 编译器
  • 编译器优化
  • 虚拟化
  • 逆向工程

标签云

ACR AI for Code AMD AMD RDNA3 AWS Aliyun Benchmark CPU CUDA Compiler DeepEP DeepSeek Docker ECR ESXi Embedded FlashAttention GPU H20 HAMi HomeLab IPv6 JupyterHub K3s Kubernetes LLM LLVM LuckFox MI50 NCCL OpenClash OpenWrt Profiling PyTorch ROCm RV1103 RX580 Register Pressure Rust Ryzen AI SQLCipher SQLite Security Triton compiler inference ucode vLLM 上海科技大学 强化学习 性能分析 指令调度 校园网 测试报告 缓存优化 编译器 编译器优化 虚拟化 逆向工程

归档

  • 六月 2026
  • 五月 2026
  • 三月 2026
  • 十二月 2025
  • 十一月 2025
  • 十月 2025
  • 二月 2025

最新文章

  • What Happens When You Increase num_warps in Triton — 寄存器压力的实证调查
  • 从零造一个 GPU 编译器:T0-GPU 作为课程项目的设计与实践
  • macOS NT QQ 聊天记录解密
  • 当 AI Agent 碰上 LLVM 后端:一场关于 GPU 指令调度的诚实实验
  • cuasmrl 部署实录:用 RL 优化 CUDA Kernel 指令调度
© 2026 youyoulyz
Powered by Hexo

沪ICP备2026020990号-1

Home Archives