项目的初始需求很简单:为一个内部的AI模型提供服务,该模型用于分析用户上传的文档(5-100MB),提取关键信息。前端团队计划使用PWA技术,提供一个类似原生应用的体验。然而,第一个架构原型就暴露了致命问题。模型推理耗时从30秒到5分钟不等
2023-10-27