مدیریت و ارزیابی عملکرد, مقالات

هوش مصنوعی مولد می‌تواند ارزیابی عملکرد را اصلاح کند یا حتی بدتر از قبل کند

هوش مصنوعی مولد می‌تواند ارزش ارزیابی‌های عملکرد را به‌طور چشمگیری افزایش دهد، اما بیشتر شرکت‌ها فعلاً فقط از آن برای تولید سریع‌تر نسخه‌های صیقلی‌ترِ ارزیابی‌های سنتی استفاده می‌کنند، نه برای بهتر کردن خودِ فرایند ارزیابی. رویکرد بهتر این است که از هوش مصنوعی مولد برای آشکار کردن شواهد واقعیِ عملکرد استفاده شود؛ یعنی تمرکز به‌جای روایت‌پردازی دربارهٔ کار، بر آنچه افراد واقعاً انجام داده‌اند، تصمیم‌هایی که گرفته‌اند و تأثیری که گذاشته‌اند قرار گیرد.

شرکت‌ها با سرعت زیادی در حال استفاده از سیستم‌های هوش مصنوعی مولد برای ساده‌سازی ارزیابی عملکرد کارکنان هستند. ابزار «Performance Assist» در سیتی‌گروپ داده‌های سراسر سازمان را جمع‌آوری می‌کند تا پیش‌نویس ارزیابی‌ها را تهیه کند. ابزار «LLM Suite» در جی‌پی مورگان به نوشتن ارزیابی‌های پایان سال کمک می‌کند. همچنین گفته می‌شود دستیار داخلی هوش مصنوعی در گروه مشاوره بوستون زمان لازم برای نوشتن ارزیابی‌ها را تا ۴۰٪ کاهش داده است. این سیستم‌ها توانایی چشمگیری دارند، اما تا اینجا بیشتر سازمان‌ها از آن‌ها صرفاً برای تولید سریع‌تر و حرفه‌ای‌ترِ همان ارزیابی‌های روایی سنتی استفاده کرده‌اند.

اما «صیقلی‌تر بودن» لزوماً به معنای «قابل‌اعتمادتر بودن» نیست. این سیستم‌ها با هموار و حرفه‌ای کردن نحوه توصیف عملکرد توسط مدیران، می‌توانند ارزیابی‌ها را منسجم‌تر و معتبرتر از واقعیت جلوه دهند و در نتیجه ناسازگاری‌ها و نقاط کور قدیمی را پنهان کنند. با این حال، همین فناوری می‌تواند کار بسیار ارزشمندتری انجام دهد: تغییر مسیر ارزیابی عملکرد از روایت‌پردازی دربارهٔ کار به سمت شواهد مستقیم از عملکرد واقعی افراد؛ یعنی اینکه کارکنان دقیقاً چه کرده‌اند، چه تصمیم‌هایی گرفته‌اند و چه تأثیری داشته‌اند.

ضعف‌هایی که هوش مصنوعی مولد می‌تواند برطرف کند

روایت‌های مربوط به ارزیابی عملکرد همیشه از مشکل ارزیابی ناهماهنگ و شواهد ناقص رنج برده‌اند. پژوهش‌ها نشان می‌دهد مدیران مختلف ممکن است عملکرد یکسان را به شکل‌هایی کاملاً متفاوت توصیف کنند؛ تفاوت‌هایی که تحت تأثیر روابط شخصی، حافظه گزینشی و توانایی داستان‌پردازی قرار دارد. زمانی هم که سازمان‌ها تلاش کرده‌اند ارزیابی‌ها را عینی‌تر کنند، معمولاً به سراغ چیزهایی رفته‌اند که اندازه‌گیری آن‌ها آسان‌تر است: خروجی‌ها، شاخص‌ها و تحویل‌های رسمی.

اما این رویکردها اغلب از تشخیص مشارکت‌های سطح بالاتری که واقعاً عملکرد برجسته را تعریف می‌کنند ناتوان‌اند؛ مثل بینش استراتژیکی که مسیر یک پروژه شکست‌خورده را عوض می‌کند، مربی‌گری‌ای که رشد دیگران را سرعت می‌بخشد یا حل تعارضی که باعث ادامه حرکت تیم می‌شود. این قابلیت‌ها معمولاً نامرئی باقی می‌مانند و در نتیجه شکافی دائمی میان آنچه سازمان‌ها می‌توانند اندازه‌گیری کنند و آنچه واقعاً عامل موفقیت است ایجاد می‌شود.

هوش مصنوعی مولد می‌تواند برای آشکار کردن این نوع مشارکت‌ها استفاده شود — و در این مقاله توضیح می‌دهم چگونه. اما بیشتر سازمان‌ها این فرصت را نادیده گرفته‌اند و هوش مصنوعی را در مسیر اشتباهی به کار می‌گیرند.

رویکرد اشتباه

برای کاهش بار ارزیابی عملکرد، بسیاری از شرکت‌ها از هوش مصنوعی برای نوشتن متن ارزیابی‌ها استفاده می‌کنند. در ظاهر، این یک پیشرفت به نظر می‌رسد؛ اما در واقع ممکن است مشکل اصلی را تشدید کند. متن‌هایی که با هوش مصنوعی تولید می‌شوند معمولاً به سمت یک لحن روان، مطمئن و استاندارد همگرا می‌شوند. تفاوت‌هایی که قبلاً میان یک ارزیابی دقیق و یک تعریف کلیشه‌ای وجود داشت، حالا در حال محو شدن در قالب صدایی متقاعدکننده اما یکنواخت است.

این همگن‌سازی فقط ظاهر را تغییر می‌دهد، نه محتوا را. مدیران همچنان بر اساس مشاهدات ناقص و برداشت‌های ذهنی قضاوت می‌کنند. هوش مصنوعی فقط باعث می‌شود همه روایت‌ها باورپذیر به نظر برسند. نتیجه، ارزیابی‌هایی است که قابل‌اعتمادتر از واقعیت جلوه می‌کنند و تشخیص اطلاعات ضعیف را دشوارتر می‌سازند.

مسیر بهتر

به‌جای اینکه هوش مصنوعی به مدیران کمک کند داستان‌های جذاب‌تری درباره عملکرد کارکنان بنویسند، می‌تواند به آن‌ها کمک کند نمونه‌های واقعی کار را پیدا و بررسی کنند. همان فناوری‌ای که اکنون باعث می‌شود شواهد ضعیف قوی‌تر به نظر برسند، می‌تواند یافتن شواهد قوی را آسان‌تر کند.

این تغییر در عمل چگونه به نظر می‌رسد؟

به‌جای اینکه از دستیار هوش مصنوعی بخواهیم پاراگرافی قانع‌کننده‌تر درباره «تفکر استراتژیک» یک کارمند بنویسد، سازمان از آن می‌خواهد یادداشت‌های تصمیم‌گیری، تغییر مسیر پروژه‌ها و ایمیل‌های بین‌بخشی‌ای را پیدا کند که آن تفکر استراتژیک را به‌وضوح نشان می‌دهند. در این حالت، ارزیابی عملکرد نه بر زبان قضاوتی، بلکه بر اسناد و شواهد اصلی متکی می‌شود. مدیران و کمیته‌های ارتقا خودِ مدارک را بررسی می‌کنند: اسناد واقعی‌ای که در آن‌ها قضاوت اعمال شده، نفوذ شکل گرفته و نتایج تغییر کرده‌اند.

  • نه عبارت کلی «رهبری استراتژیک نشان می‌دهد»، بلکه همان یادداشت مشخصی که در آن یک فرض اشتباه شناسایی و اصلاح شد.
  • نه «توانایی مدیریت ابهام دارد»، بلکه همان گزارش تحلیلی پس از شکست پروژه که طی آن مسیر پروژه بازسازی شد.
  • نه «نفوذ بین‌بخشی فوق‌العاده‌ای دارد»، بلکه همان دستورالعمل‌های واقعی‌ای که باعث بازسازی ساختار منطقه‌ای شدند.

به این ترتیب، ارزیابی رفتاری در مقیاس گسترده عملی می‌شود؛ زیرا هوش مصنوعی هزینه بالای یافتن و تحلیل شواهد مرتبط را به‌شدت کاهش داده است. سیستم‌های هوش مصنوعی می‌توانند الگوهای تعامل کارکنان را تحلیل کنند تا شواهدی از مهارت‌های سطح بالا را آشکار کنند؛ مهارت‌هایی که معیارهای سنتی کاملاً از دست می‌دهند. این سیستم‌ها می‌توانند شبکه‌های ارتباطی را بررسی کنند تا کارکنانی را بیابند که به‌طور مداوم به دیگران در حل مشکلات کمک می‌کنند، الگوهای تصمیم‌گیری در بحث‌های پروژه را تحلیل کنند تا تفکر استراتژیک را شناسایی کنند یا جریان نفوذ در ایمیل‌ها و صورت‌جلسه‌ها را ترسیم کنند تا رهبری واقعی را آشکار سازند.

این تغییر دیگر صرفاً نظری نیست. در کنار استقرار فعلی سیستم‌های هوش مصنوعی، روند موازی دیگری نیز به‌تدریج زیرساخت این تحول را فراهم کرده است: سازمان‌های بیشتری در حال آزمایش ارزیابی مبتنی بر شواهد هستند. برای مثال، سازمان‌های فروش مدت‌هاست نمایندگان فروش را براساس داده‌های ثبت‌شده در سیستم‌ها ارزیابی می‌کنند؛ مانند میزان تحقق سهمیه فروش، نرخ موفقیت معاملات، سرعت بستن قراردادها و حجم فعالیت‌ها که مستقیماً از داشبوردهای CRM استخراج می‌شود. آمازون نیز فرایند ارزیابی «Forte» را بازطراحی کرده و از کارکنان شرکتی خود خواسته است سه تا پنج دستاورد مشخص — مانند پروژه‌های تحویل‌شده، اهداف محقق‌شده، ابتکارهای راه‌اندازی‌شده یا بهبود فرایندها — را به‌عنوان بخشی کلیدی از خودارزیابی ارائه دهند.

این تلاش‌ها نشانه پیشرفت هستند، اما هنوز به چیزهایی محدود می‌شوند که اندازه‌گیری آن‌ها آسان‌تر است. شاخص‌ها خروجی را اندازه می‌گیرند، نه مشارکت‌های عمیق‌تری را که نتایج را شکل می‌دهند؛ مانند آینده‌نگری معماری، مربی‌گری و رهبری مشارکتی. این همان شکافی است که هوش مصنوعی اکنون می‌تواند به بستن آن کمک کند.

استفاده از ظرفیت واقعی هوش مصنوعی مولد

زیرساخت‌های لازم عملاً وجود دارند. رهبران ارشد می‌توانند همین حالا اقدامات زیر را انجام دهند تا این امکان را به واقعیت تبدیل کنند:

۱. بازتعریف گفت‌وگوی عملکرد بر اساس لحظات مهم، نه برچسب‌های شخصیتی و ادعاهای کلی

به‌جای اینکه از مدیران خواسته شود «رهبری»، «تفکر استراتژیک» یا «توانایی مدیریت ابهام» یک کارمند را توصیف کنند، ارزیابی عملکرد باید سؤال متفاوتی بپرسد:
کدام لحظه در کار این فرد، این قابلیت‌ها را به‌روشنی نشان می‌دهد؟

یک موقعیت مهم — مثلاً جایی که کارمند یک فرض اشتباه را به چالش کشیده، مسیر یک پروژه شکست‌خورده را تغییر داده یا ذی‌نفعان را حول یک تصمیم دشوار همسو کرده — اغلب بیش از یک صفحه متن قضاوتی درباره توانایی واقعی او اطلاعات می‌دهد. هوش مصنوعی می‌تواند با بررسی سوابق پروژه، ارتباطات و اسناد، این لحظات کلیدی را شناسایی کند؛ یعنی نقاطی که قضاوت و تصمیم‌گیری بیشترین اهمیت را داشته‌اند. در نتیجه، گفت‌وگو درباره عملکرد از بحث بر سر صفت‌ها به بررسی شواهد تغییر می‌کند: چه تصمیمی گرفته شد، چه منطقی پشت آن بود، چه گزینه‌هایی بررسی شدند و در نهایت چه اتفاقی افتاد.

اقدام عملی برای صبح دوشنبه:
در گفت‌وگوی بعدی ارزیابی عملکرد، سؤال‌های متفاوتی بپرسید.
به‌جای «به تفکر استراتژیک خود چه امتیازی می‌دهی؟» بپرسید:
«کدام لحظه در این فصل کاری، تفکر استراتژیک تو را بهتر نشان داد؟»

به‌جای «رهبری خود را چگونه ارزیابی می‌کنی؟» بپرسید:
«در چه زمانی نفوذ تو مسیر یک پروژه را واقعاً تغییر داد؟»

۲. ابزارهای هوش مصنوعی موجود در سازمان را برای یافتن شواهد رفتاری به‌کار بگیرید، نه صیقل دادن روایت‌ها

بیشتر شرکت‌ها همین حالا هم از دستیارهای هوش مصنوعی در ابزارهای روزمره کاری استفاده می‌کنند؛ مانند Microsoft Copilot، هوش مصنوعی Google Workspace، Claude Cowork یا دستیارهای داخلی سازمانی. امروز این سیستم‌ها معمولاً برای خلاصه‌سازی اسناد یا کمک به مدیران در نوشتن روایت‌های حرفه‌ای‌تر استفاده می‌شوند. اما سازمان‌ها باید آن‌ها را به سمت مأموریت دیگری هدایت کنند: تحلیل الگوهای تعامل کارکنان برای آشکار کردن شواهدی از مهارت‌های سطح بالا.

اقدام عملی برای صبح دوشنبه:
از دستیار هوش مصنوعی فعلی خود بخواهید نمونه‌هایی را پیدا کند که در آن کارکنان بر تصمیم‌ها تأثیر گذاشته‌اند یا به حل مشکل کمک کرده‌اند، نه اینکه متن ارزیابی بنویسد.

مثلاً به‌جای این دستور:
«کمکم کن برای [نام کارمند] ارزیابی عملکرد بنویسم.»

از این استفاده کنید:
«نمونه‌هایی پیدا کن که در آن [نام کارمند] مسیر یک پروژه را تغییر داده یا به کسی در حل یک مشکل فنی کمک کرده است.»

۳. نظام حکمرانی‌ای بسازید که میان شفافیت، اختیار کارکنان و جلوگیری از نظارت افراطی تعادل ایجاد کند

حرکت به سمت شواهد رفتاری گردآوری‌شده توسط هوش مصنوعی نیازمند چارچوبی است که میان راستی‌آزمایی، اختیار کارکنان و مرزهای روشن تعادل برقرار کند.

راستی‌آزمایی

هوش مصنوعی باید فقط نقش گردآورنده و پیشنهاددهنده شواهد را داشته باشد و تمام قضاوت‌های تفسیری همچنان بر عهده انسان باقی بماند. هر مدرکی که هوش مصنوعی ارائه می‌کند باید مستقیماً به منبع اصلی خود متصل باشد تا مدیران بتوانند مستقلاً آن را بررسی کنند.

اختیار کارکنان

کارکنان باید بر «پورتفوی شواهد» خود کنترل داشته باشند. مثلاً سیستم هوش مصنوعی ابتدا رویدادهای رفتاری مرتبط را شناسایی کرده و به خودِ کارمند نمایش دهد، سپس او انتخاب کند کدام شواهد در ارزیابی عملکردش استفاده شوند.

مرزهای شفاف برای جلوگیری از گسترش نظارت

ارزیابی عملکرد باید بر اسناد رسمی کاری متکی باشد — مانند اسناد طراحی، گزارش‌های مرور پروژه، پیشنهادهای مشتری و مشخصات فنی — نه بر پیام‌های خصوصی یا گفت‌وگوهای غیررسمی. سازمان‌ها باید دقیقاً مشخص کنند کدام سیستم‌ها در محدوده ارزیابی قرار می‌گیرند، بازه زمانی بررسی شواهد چقدر است و چه نوع اسنادی مجاز هستند. هوش مصنوعی هرگز نباید خودش امتیاز عملکرد بدهد یا تصمیم خودکار بگیرد؛ فقط باید شواهد را گردآوری کند تا انسان‌ها در چارچوبی گسترده‌تر آن‌ها را تفسیر کنند.

اقدام عملی برای صبح دوشنبه:
به‌طور شفاف مشخص کنید کدام کانال‌های ارتباطی و انواع اسناد می‌توانند به‌عنوان شواهد عملکرد استفاده شوند و کدام‌ها ممنوع‌اند.

مثلاً صریح بگویید:
«ارزیابی عملکرد می‌تواند بر اسناد پروژه، یادداشت‌های جلسات و تصمیم‌های طراحی متکی باشد، اما نه بر پیام‌های خصوصی Slack، ایمیل‌های شخصی یا گفت‌وگوهای غیررسمی.»

این اقدامات مسیری ایجاد می‌کنند که محدودیت‌های فعلی در سنجش عملکرد را به فرصت‌های سازمانی آینده تبدیل می‌کند. سازمان‌هایی که این مسیر را انتخاب کنند، فقط فرایند ارزیابی عملکرد خود را بهبود نمی‌دهند؛ بلکه سیستم‌هایی می‌سازند که تمام طیف توانایی‌های انسانیِ مؤثر در موفقیت پایدار را شناسایی، پرورش و پاداش می‌دهند.

فناوری لازم همین حالا وجود دارد. نمونه‌های سازمانی آن نیز در حال شکل‌گیری هستند. تنها سؤال این است که آیا رهبران از هوش مصنوعی برای ادامه دادن یک سیستم ناکارآمد استفاده خواهند کرد یا آن را به چیزی تبدیل می‌کنند که بالاخره بتواند ویژگی‌های واقعی افراد برجسته را به‌درستی ثبت و شناسایی کند.

منابع

https://hbr.org/2026/05/gen-ai-could-fix-performance-reviews-or-make-them-even-worse

ترجمه: سونیا جلالی

درباره سونیا جلالی

من سونیا جلالی هستم، موسس آکادمی تخصصی مدیریت منابع انسانی، نزدیک به دو دهه در حوزه مدیریت منابع انسانی کارکردم و عناوین مختلفی را یدک کشیدم. از زمانی که مدیریت منابع انسانی را شناختم جایگزین بهتری برای آن پیدا نکردم که به بودن من معنا دهد، شناخت انسان‌ها و پيچيدگی‌هاشون و كمك به آنها برای رشد و توسعه و موثر بودن شان در سازمان چيزی بود كه در پی‌اش بودم و يافتمش و رفته رفته خواندم و تجربه كردم و آموختم و لذت بردم و رشد کردم.