在当今快速发展的企业环境中,员工的心理健康已成为组织不可忽视的重要方面。许多公司意识到,最大资产在于他们的优秀员工,每位员工都在集体成功中扮演着关键角色。因此,创造一个安全、包容和支持的环境,促进员工的心理健康至关重要。
然而,量化和评估心理健康可能是一项艰巨的任务。传统的方法,如员工心理健康调查或手动方法,可能并不总能提供最准确或可行动的洞察。本文探讨了一种利用 Amazon SageMaker Canvas 进行心理健康评估的创新解决方案。
我们将深入探讨以下主题:
心理健康在工作场所的重要性SageMaker Canvas 的低代码无代码平台概述心理健康评估模型:使用聊天功能进行数据准备在 SageMaker Canvas 上训练模型模型评估与性能指标部署与集成:部署心理健康评估模型将模型集成到工作场所健康计划或人力资源系统中在本篇文章中,我们使用了一份 2014 年的调查数据,其测量了科技工作场所对心理健康的态度以及心理健康障碍的频率,然后利用 Amazon SageMaker Data Wrangler 聚合并准备数据构建 ML 模型,最后在 SageMaker Canvas 上训练、构建、测试并部署该模型,而无需编写任何代码。
了解 SageMaker Canvas 如何在组织中变革心理健康评估的方式,使其能够创造一个更具支持性和生产力的工作环境。敬请关注更多有见地的内容,这些内容可能会重塑工作场所健康的未来。
在工作场所保持良好的心理健康对员工和雇主来说都至关重要。在当今快速变革、要求苛刻的工作环境中,员工的心理健康状况对生产力、工作满意度和整体公司成功具有重大影响。在亚马逊,创新和客户至上的价值观贯穿始终,因此我们深刻理解培养心理健康的员工队伍的重要性。
我们优先考虑员工的心理健康,创造一个使他们能够蓬勃发展、贡献最好表现的环境。这有助于我们交付卓越的产品和服务。亚马逊通过提供资源和支持服务来支持心理健康。所有美国员工及其家庭成员每年每个问题均可通过亚马逊全球员工援助计划EAP或生活资源获得五次免费的咨询服务。员工还可以通过与 Twill 合作,以数字化、自我引导的心理健康项目获取全时段的心理健康护理。亚马逊还与 Brightline 合作,为儿童和青少年提供虚拟心理健康支持。
SageMaker Canvas 汇集了一系列功能,帮助数据专业人员在无需编写代码的情况下准备、构建、训练和部署 ML 模型。SageMaker Data Wrangler 还整合进了 SageMaker Canvas,减少了导入、准备、转换、特征化和分析数据所需的时间。在单一可视化界面中,您可以完成数据准备工作流的每个步骤:数据选择、清洗、探索、可视化和处理。此外,定制 Spark 命令也可以扩展超过 300 种内置的数据转换。内置的 数据质量和洞察报告 可以指导您进行适当的数据清洗、验证数据质量,并发现如重复行和目标泄露等异常情况。其他分析 也是可用的,帮助您可视化和理解您的数据。
在本文中,我们试图系统性地了解影响科技行业员工心理健康的因素。我们首先了解特征列,具体内容见下表。
调查属性调查属性描述Timestamp调查进行的时间戳Age进行调查的人的年龄Gender进行调查的人的性别Country进行调查的人的国家state如果您居住在美国,您居住的州或领地selfemployed您是否为自雇人士?familyhistory您是否有心理疾病的家族史?treatment您是否寻求过心理健康状况的治疗?workinterfere如果您有心理健康状况,您感觉它是否影响您的工作?noemployees您的公司或组织有多少员工?remotework您是否至少有 50 的时间在远程工作不在办公室?techcompany您的雇主属于主要的科技公司/组织吗?benefits您的雇主是否提供心理健康福利?careoptions您是否知道雇主提供的心理健康护理选项?wellnessprogram雇主是否曾在员工健康计划中讨论心理健康?seekhelp您的雇主是否提供资源以了解更多关于心理健康问题的信息以及如何寻求帮助?anonymity如果您选择利用心理健康或物质滥用治疗资源,您的匿名性是否受到保护?leave您请假治疗心理健康状况的难易程度如何?mentalhealthconsequence您认为与雇主谈论心理健康问题会产生负面后果吗?physhealthconsequence您认为与雇主谈论身体健康问题会产生负面后果吗?coworkers您愿意与同事讨论心理健康问题吗?physhealthinterview您在面试中会提及身体健康问题吗?mentalvsphysical您觉得雇主对待心理健康的重视程度与身体健康相当吗?obsconsequence您是否听说或观察到同事在工作场所因心理健康问题而受到的负面影响?comments任何其他备注或评论在构建此模型之前,您需要完成以下前提条件:
拥有 AWS 账户设置一个 SageMaker 域下载 样本数据集初步设置完成后,您可以通过以下任一种方法访问 SageMaker Canvas,具体取决于您环境的设置:
在 SageMaker 控制台中,在导航窗格中选择 Canvas。从下拉菜单中选择您的用户,然后启动 SageMaker Canvas 应用程序。要使用 Amazon SageMaker Studio,请导航到 SageMaker Studio 界面。在 SageMaker Canvas 页面中启动 SageMaker Canvas 应用程序。您还可以使用组织的 SAML 20 基于单点登录SSO方法,如 AWS IAM 身份中心。要了解更多信息,请参见 使用 AWS SSO 和 SAML 应用程序安全访问 Amazon SageMaker Studio。在 SageMaker Canvas 中,您可以看到快速操作,以开始构建和使用 ML 及生成式人工智能AI模型,使用无代码平台。可以自由探索任何现成的模型。
我们从创建数据流开始。SageMaker Canvas 中的数据流 用于构建一个数据准备管道,该管道可以安排自动导入、准备并输入到模型构建中。使用数据流,您可以利用生成式 AI、超过 300 种内置转换或自定义 Spark 命令准备数据。
请完成以下步骤:
选择 准备和分析数据。在 数据流名称 中输入一个名称例如,AssessingMentalHealthFlow。选择 创建。SageMaker Data Wrangler 会打开。
您可以从多个来源导入数据,这些数据包括 AWS 服务,如 Amazon 简单存储服务Amazon S3和 Amazon Redshift,以及第三方或合作伙伴服务,包括 Snowflake 或 Databricks。要了解更多关于将数据导入 SageMaker Canvas 的信息,请参见 将数据导入 Canvas。
选择 导入数据,然后选择 表格。上传您在前提条件部分下载的数据集。在成功导入后,您将看到数据的预览,您可以浏览这些数据。
选择 导入数据 以完成此步骤。导入数据集后,SageMaker Data Wrangler 数据流将打开。您可以运行数据质量和洞察报告,它将分析数据以确定在数据准备过程中需要解决的潜在问题。请完成以下步骤:
选择 运行数据质量和洞察报告。在 分析名称 中输入一个名称。在 目标列 中选择 treatment。在 问题类型 中选择 分类。在 数据大小 中选择 抽样数据集。选择 创建。您将看到生成的报告,其中详细说明了在添加数据转换和推进模型构建过程中需要注意的任何高优先级警告、数据问题及其他洞察信息。
在特定数据集中,我们可以看到有 27 个不同类型的特征,非常少列缺失数据,并且没有重复。想要深入了解报告,可以参考 获取数据和数据质量的洞察。有关其他可用分析的信息,请参见 分析和可视化。
如同 ML 过程所期望的,您的数据集可能需要进行转换,以解决缺失值、异常值等问题,或在模型构建之前进行特征工程。SageMaker Canvas 提供了 ML 数据转换,用于清理、转换和准备数据,以便进行模型构建,而无需编写代码。所使用的转换将添加到模型食谱中,记录在构建模型之前对数据进行的准备。您可以参考这些 高级转换,并将其作为转换步骤添加到您的 Data Wrangler 流中。
啊哈加速器安卓下载另外,您还可以使用 SageMaker Canvas 与数据聊天 并添加转换。我们将通过一些示例在我们的样本数据集中探索这个选项。
在使用聊天功能准备数据之前,请注意以下几点:
数据准备的聊天需要 AmazonSageMakerCanvasAIServicesAccess 策略。有关更多信息,请参见 AWS 托管策略:AmazonSageMakerCanvasAIServicesAccess。数据准备的聊天需要访问 Amazon Bedrock 和其中的 Anthropic Claude v2 模型。有关更多信息,请参见 模型访问。您必须在与您正在运行模型的区域相同的 AWS 区域中运行 SageMaker Canvas 数据准备。数据准备聊天功能适用于美国东部弗吉尼亚州北部、美国西部俄勒冈州和欧洲法兰克福地区。与数据聊天,请完成以下步骤:
打开您的 SageMaker Canvas 数据流。通过选择 源 或 数据类型 打开数据集。选择 数据准备聊天,并在聊天窗口中指定您的提示。
您还可以选择,如果生成了分析,则选择 添加到分析 以备后用。如果您使用提示转换了数据,请执行以下操作:
选择 预览 查看结果。可选地,修改转换中的代码并选择 更新。如果您对转换的结果满意,选择 添加到步骤,将其添加到步骤窗格中。让我们通过聊天功能尝试几个探索性分析和转换。
在以下示例中,我们询问“数据集中有多少行?”
在下一个示例中,我们删除 Timestamp、Country、state 和 comments 列,因为这些特征对我们模型分类的影响最小。选择 查看代码 以查看生成的 Spark 代码,然后选择 添加到步骤 将转换添加到数据流中。
您可以提供一个名称并选择 更新 以保存数据流。
在下一个示例中,我们询问“显示所有按年龄排序的唯一值”。
一些年份是负数,因此我们应该过滤有效年龄。我们删除年龄低于 0 或高于 100 的行,并将其添加到步骤中。
接下来的示例中,我们询问“为数据集中的空值创建条形图”。
接着我们要求为 treatment 列生成条形图。
在下一个示例中,我们要求为 workinterfere 列生成条形图。
在 workinterfere 列中,我们用“不知道”替换 NA 值。我们希望使模型对缺失值的权重与那些回答“不知道”的人权重相同。
对于 selfemployed 列,我们希望用“否”替换 NA,以使模型对缺失值的权重与那些回答“NA”的人权重相同。
您可以选择根据需要添加任何其他转换。如果您遵循了前面的转换步骤,则您的步骤应如下所示。
现在数据已经完成转换,您可能想进行分析以确保它们没有影响数据完整性。
为此,导航到 分析 标签以创建分析。对于该示例,我们创建特征相关性分析,相关类型为线性。
分析报告将生成相关性矩阵。相关性矩阵测量特征之间的正相关或负相关。越接近 1 的值表示正相关,越接近 1 的值表示负相关。
线性特征相关性基于 皮尔逊相关系数。为了找到数值变量如年龄或收入与分类变量如性别或教育水平之间的关系,我们首先将类别分配给分类,以便它们能够最好地预测数值变量。然后我们计算相关系数,它测量两个变量之间的相关性强度。
线性分类与分类之间的相关性不受支持。
数值与数值之间的相关性范围为 [1 1],其中 0 表示没有相关性,1 表示完全正相关,1 表示完全负相关。数值与分类之间以及分类与分类之间的相关性范围为 [0 1],其中 0 表示没有相关性,1 表示完全相关。

以下表格列出了每个特征与之最相关的特征。
特征最相关特征相关性Age (数值)Gender (分类)0248216Gender (分类)Age (数值)0248216seekhelp (分类)Age (数值)0175808noemployees (分类)Age (数值)0166486benefits (分类)Age (数值)0157729remotework (分类)Age (数值)0139105careoptions (分类)Age (数值)011832026-01-27 12:33:26
实时通话分析工作坊关键要点新推出的 Amazon Chime SDK实时通话分析 使企业能够提升客户体验。通过 使用 Amazon Chime 通话分析工作坊 学习如何配置和使用这些功能。实时通话分析...
使用 Oracle Real Application Clusters 设定 AWS DMS 源端关键要点AWS 数据库迁移服务 (DMS) 是一项托管迁移和复制服务,能够快速、安全地将数据库迁移至 ...