هوش مصنوعی مولد میتواند ارزیابی عملکرد را اصلاح کند یا حتی بدتر از قبل کند
هوش مصنوعی مولد میتواند ارزش ارزیابیهای عملکرد را بهطور چشمگیری افزایش دهد، اما بیشتر شرکتها فعلاً فقط از آن برای تولید سریعتر نسخههای صیقلیترِ ارزیابیهای سنتی استفاده میکنند، نه برای بهتر کردن خودِ فرایند ارزیابی. رویکرد بهتر این است که از هوش مصنوعی مولد برای آشکار کردن شواهد واقعیِ عملکرد استفاده شود؛ یعنی تمرکز بهجای روایتپردازی دربارهٔ کار، بر آنچه افراد واقعاً انجام دادهاند، تصمیمهایی که گرفتهاند و تأثیری که گذاشتهاند قرار گیرد.
شرکتها با سرعت زیادی در حال استفاده از سیستمهای هوش مصنوعی مولد برای سادهسازی ارزیابی عملکرد کارکنان هستند. ابزار «Performance Assist» در سیتیگروپ دادههای سراسر سازمان را جمعآوری میکند تا پیشنویس ارزیابیها را تهیه کند. ابزار «LLM Suite» در جیپی مورگان به نوشتن ارزیابیهای پایان سال کمک میکند. همچنین گفته میشود دستیار داخلی هوش مصنوعی در گروه مشاوره بوستون زمان لازم برای نوشتن ارزیابیها را تا ۴۰٪ کاهش داده است. این سیستمها توانایی چشمگیری دارند، اما تا اینجا بیشتر سازمانها از آنها صرفاً برای تولید سریعتر و حرفهایترِ همان ارزیابیهای روایی سنتی استفاده کردهاند.
اما «صیقلیتر بودن» لزوماً به معنای «قابلاعتمادتر بودن» نیست. این سیستمها با هموار و حرفهای کردن نحوه توصیف عملکرد توسط مدیران، میتوانند ارزیابیها را منسجمتر و معتبرتر از واقعیت جلوه دهند و در نتیجه ناسازگاریها و نقاط کور قدیمی را پنهان کنند. با این حال، همین فناوری میتواند کار بسیار ارزشمندتری انجام دهد: تغییر مسیر ارزیابی عملکرد از روایتپردازی دربارهٔ کار به سمت شواهد مستقیم از عملکرد واقعی افراد؛ یعنی اینکه کارکنان دقیقاً چه کردهاند، چه تصمیمهایی گرفتهاند و چه تأثیری داشتهاند.
ضعفهایی که هوش مصنوعی مولد میتواند برطرف کند
روایتهای مربوط به ارزیابی عملکرد همیشه از مشکل ارزیابی ناهماهنگ و شواهد ناقص رنج بردهاند. پژوهشها نشان میدهد مدیران مختلف ممکن است عملکرد یکسان را به شکلهایی کاملاً متفاوت توصیف کنند؛ تفاوتهایی که تحت تأثیر روابط شخصی، حافظه گزینشی و توانایی داستانپردازی قرار دارد. زمانی هم که سازمانها تلاش کردهاند ارزیابیها را عینیتر کنند، معمولاً به سراغ چیزهایی رفتهاند که اندازهگیری آنها آسانتر است: خروجیها، شاخصها و تحویلهای رسمی.
اما این رویکردها اغلب از تشخیص مشارکتهای سطح بالاتری که واقعاً عملکرد برجسته را تعریف میکنند ناتواناند؛ مثل بینش استراتژیکی که مسیر یک پروژه شکستخورده را عوض میکند، مربیگریای که رشد دیگران را سرعت میبخشد یا حل تعارضی که باعث ادامه حرکت تیم میشود. این قابلیتها معمولاً نامرئی باقی میمانند و در نتیجه شکافی دائمی میان آنچه سازمانها میتوانند اندازهگیری کنند و آنچه واقعاً عامل موفقیت است ایجاد میشود.
هوش مصنوعی مولد میتواند برای آشکار کردن این نوع مشارکتها استفاده شود — و در این مقاله توضیح میدهم چگونه. اما بیشتر سازمانها این فرصت را نادیده گرفتهاند و هوش مصنوعی را در مسیر اشتباهی به کار میگیرند.
رویکرد اشتباه
برای کاهش بار ارزیابی عملکرد، بسیاری از شرکتها از هوش مصنوعی برای نوشتن متن ارزیابیها استفاده میکنند. در ظاهر، این یک پیشرفت به نظر میرسد؛ اما در واقع ممکن است مشکل اصلی را تشدید کند. متنهایی که با هوش مصنوعی تولید میشوند معمولاً به سمت یک لحن روان، مطمئن و استاندارد همگرا میشوند. تفاوتهایی که قبلاً میان یک ارزیابی دقیق و یک تعریف کلیشهای وجود داشت، حالا در حال محو شدن در قالب صدایی متقاعدکننده اما یکنواخت است.
این همگنسازی فقط ظاهر را تغییر میدهد، نه محتوا را. مدیران همچنان بر اساس مشاهدات ناقص و برداشتهای ذهنی قضاوت میکنند. هوش مصنوعی فقط باعث میشود همه روایتها باورپذیر به نظر برسند. نتیجه، ارزیابیهایی است که قابلاعتمادتر از واقعیت جلوه میکنند و تشخیص اطلاعات ضعیف را دشوارتر میسازند.
مسیر بهتر
بهجای اینکه هوش مصنوعی به مدیران کمک کند داستانهای جذابتری درباره عملکرد کارکنان بنویسند، میتواند به آنها کمک کند نمونههای واقعی کار را پیدا و بررسی کنند. همان فناوریای که اکنون باعث میشود شواهد ضعیف قویتر به نظر برسند، میتواند یافتن شواهد قوی را آسانتر کند.
این تغییر در عمل چگونه به نظر میرسد؟
بهجای اینکه از دستیار هوش مصنوعی بخواهیم پاراگرافی قانعکنندهتر درباره «تفکر استراتژیک» یک کارمند بنویسد، سازمان از آن میخواهد یادداشتهای تصمیمگیری، تغییر مسیر پروژهها و ایمیلهای بینبخشیای را پیدا کند که آن تفکر استراتژیک را بهوضوح نشان میدهند. در این حالت، ارزیابی عملکرد نه بر زبان قضاوتی، بلکه بر اسناد و شواهد اصلی متکی میشود. مدیران و کمیتههای ارتقا خودِ مدارک را بررسی میکنند: اسناد واقعیای که در آنها قضاوت اعمال شده، نفوذ شکل گرفته و نتایج تغییر کردهاند.
- نه عبارت کلی «رهبری استراتژیک نشان میدهد»، بلکه همان یادداشت مشخصی که در آن یک فرض اشتباه شناسایی و اصلاح شد.
- نه «توانایی مدیریت ابهام دارد»، بلکه همان گزارش تحلیلی پس از شکست پروژه که طی آن مسیر پروژه بازسازی شد.
- نه «نفوذ بینبخشی فوقالعادهای دارد»، بلکه همان دستورالعملهای واقعیای که باعث بازسازی ساختار منطقهای شدند.
به این ترتیب، ارزیابی رفتاری در مقیاس گسترده عملی میشود؛ زیرا هوش مصنوعی هزینه بالای یافتن و تحلیل شواهد مرتبط را بهشدت کاهش داده است. سیستمهای هوش مصنوعی میتوانند الگوهای تعامل کارکنان را تحلیل کنند تا شواهدی از مهارتهای سطح بالا را آشکار کنند؛ مهارتهایی که معیارهای سنتی کاملاً از دست میدهند. این سیستمها میتوانند شبکههای ارتباطی را بررسی کنند تا کارکنانی را بیابند که بهطور مداوم به دیگران در حل مشکلات کمک میکنند، الگوهای تصمیمگیری در بحثهای پروژه را تحلیل کنند تا تفکر استراتژیک را شناسایی کنند یا جریان نفوذ در ایمیلها و صورتجلسهها را ترسیم کنند تا رهبری واقعی را آشکار سازند.
این تغییر دیگر صرفاً نظری نیست. در کنار استقرار فعلی سیستمهای هوش مصنوعی، روند موازی دیگری نیز بهتدریج زیرساخت این تحول را فراهم کرده است: سازمانهای بیشتری در حال آزمایش ارزیابی مبتنی بر شواهد هستند. برای مثال، سازمانهای فروش مدتهاست نمایندگان فروش را براساس دادههای ثبتشده در سیستمها ارزیابی میکنند؛ مانند میزان تحقق سهمیه فروش، نرخ موفقیت معاملات، سرعت بستن قراردادها و حجم فعالیتها که مستقیماً از داشبوردهای CRM استخراج میشود. آمازون نیز فرایند ارزیابی «Forte» را بازطراحی کرده و از کارکنان شرکتی خود خواسته است سه تا پنج دستاورد مشخص — مانند پروژههای تحویلشده، اهداف محققشده، ابتکارهای راهاندازیشده یا بهبود فرایندها — را بهعنوان بخشی کلیدی از خودارزیابی ارائه دهند.
این تلاشها نشانه پیشرفت هستند، اما هنوز به چیزهایی محدود میشوند که اندازهگیری آنها آسانتر است. شاخصها خروجی را اندازه میگیرند، نه مشارکتهای عمیقتری را که نتایج را شکل میدهند؛ مانند آیندهنگری معماری، مربیگری و رهبری مشارکتی. این همان شکافی است که هوش مصنوعی اکنون میتواند به بستن آن کمک کند.
استفاده از ظرفیت واقعی هوش مصنوعی مولد
زیرساختهای لازم عملاً وجود دارند. رهبران ارشد میتوانند همین حالا اقدامات زیر را انجام دهند تا این امکان را به واقعیت تبدیل کنند:
۱. بازتعریف گفتوگوی عملکرد بر اساس لحظات مهم، نه برچسبهای شخصیتی و ادعاهای کلی
بهجای اینکه از مدیران خواسته شود «رهبری»، «تفکر استراتژیک» یا «توانایی مدیریت ابهام» یک کارمند را توصیف کنند، ارزیابی عملکرد باید سؤال متفاوتی بپرسد:
کدام لحظه در کار این فرد، این قابلیتها را بهروشنی نشان میدهد؟
یک موقعیت مهم — مثلاً جایی که کارمند یک فرض اشتباه را به چالش کشیده، مسیر یک پروژه شکستخورده را تغییر داده یا ذینفعان را حول یک تصمیم دشوار همسو کرده — اغلب بیش از یک صفحه متن قضاوتی درباره توانایی واقعی او اطلاعات میدهد. هوش مصنوعی میتواند با بررسی سوابق پروژه، ارتباطات و اسناد، این لحظات کلیدی را شناسایی کند؛ یعنی نقاطی که قضاوت و تصمیمگیری بیشترین اهمیت را داشتهاند. در نتیجه، گفتوگو درباره عملکرد از بحث بر سر صفتها به بررسی شواهد تغییر میکند: چه تصمیمی گرفته شد، چه منطقی پشت آن بود، چه گزینههایی بررسی شدند و در نهایت چه اتفاقی افتاد.
اقدام عملی برای صبح دوشنبه:
در گفتوگوی بعدی ارزیابی عملکرد، سؤالهای متفاوتی بپرسید.
بهجای «به تفکر استراتژیک خود چه امتیازی میدهی؟» بپرسید:
«کدام لحظه در این فصل کاری، تفکر استراتژیک تو را بهتر نشان داد؟»
بهجای «رهبری خود را چگونه ارزیابی میکنی؟» بپرسید:
«در چه زمانی نفوذ تو مسیر یک پروژه را واقعاً تغییر داد؟»
۲. ابزارهای هوش مصنوعی موجود در سازمان را برای یافتن شواهد رفتاری بهکار بگیرید، نه صیقل دادن روایتها
بیشتر شرکتها همین حالا هم از دستیارهای هوش مصنوعی در ابزارهای روزمره کاری استفاده میکنند؛ مانند Microsoft Copilot، هوش مصنوعی Google Workspace، Claude Cowork یا دستیارهای داخلی سازمانی. امروز این سیستمها معمولاً برای خلاصهسازی اسناد یا کمک به مدیران در نوشتن روایتهای حرفهایتر استفاده میشوند. اما سازمانها باید آنها را به سمت مأموریت دیگری هدایت کنند: تحلیل الگوهای تعامل کارکنان برای آشکار کردن شواهدی از مهارتهای سطح بالا.
اقدام عملی برای صبح دوشنبه:
از دستیار هوش مصنوعی فعلی خود بخواهید نمونههایی را پیدا کند که در آن کارکنان بر تصمیمها تأثیر گذاشتهاند یا به حل مشکل کمک کردهاند، نه اینکه متن ارزیابی بنویسد.
مثلاً بهجای این دستور:
«کمکم کن برای [نام کارمند] ارزیابی عملکرد بنویسم.»
از این استفاده کنید:
«نمونههایی پیدا کن که در آن [نام کارمند] مسیر یک پروژه را تغییر داده یا به کسی در حل یک مشکل فنی کمک کرده است.»
۳. نظام حکمرانیای بسازید که میان شفافیت، اختیار کارکنان و جلوگیری از نظارت افراطی تعادل ایجاد کند
حرکت به سمت شواهد رفتاری گردآوریشده توسط هوش مصنوعی نیازمند چارچوبی است که میان راستیآزمایی، اختیار کارکنان و مرزهای روشن تعادل برقرار کند.
راستیآزمایی
هوش مصنوعی باید فقط نقش گردآورنده و پیشنهاددهنده شواهد را داشته باشد و تمام قضاوتهای تفسیری همچنان بر عهده انسان باقی بماند. هر مدرکی که هوش مصنوعی ارائه میکند باید مستقیماً به منبع اصلی خود متصل باشد تا مدیران بتوانند مستقلاً آن را بررسی کنند.
اختیار کارکنان
کارکنان باید بر «پورتفوی شواهد» خود کنترل داشته باشند. مثلاً سیستم هوش مصنوعی ابتدا رویدادهای رفتاری مرتبط را شناسایی کرده و به خودِ کارمند نمایش دهد، سپس او انتخاب کند کدام شواهد در ارزیابی عملکردش استفاده شوند.
مرزهای شفاف برای جلوگیری از گسترش نظارت
ارزیابی عملکرد باید بر اسناد رسمی کاری متکی باشد — مانند اسناد طراحی، گزارشهای مرور پروژه، پیشنهادهای مشتری و مشخصات فنی — نه بر پیامهای خصوصی یا گفتوگوهای غیررسمی. سازمانها باید دقیقاً مشخص کنند کدام سیستمها در محدوده ارزیابی قرار میگیرند، بازه زمانی بررسی شواهد چقدر است و چه نوع اسنادی مجاز هستند. هوش مصنوعی هرگز نباید خودش امتیاز عملکرد بدهد یا تصمیم خودکار بگیرد؛ فقط باید شواهد را گردآوری کند تا انسانها در چارچوبی گستردهتر آنها را تفسیر کنند.
اقدام عملی برای صبح دوشنبه:
بهطور شفاف مشخص کنید کدام کانالهای ارتباطی و انواع اسناد میتوانند بهعنوان شواهد عملکرد استفاده شوند و کدامها ممنوعاند.
مثلاً صریح بگویید:
«ارزیابی عملکرد میتواند بر اسناد پروژه، یادداشتهای جلسات و تصمیمهای طراحی متکی باشد، اما نه بر پیامهای خصوصی Slack، ایمیلهای شخصی یا گفتوگوهای غیررسمی.»
این اقدامات مسیری ایجاد میکنند که محدودیتهای فعلی در سنجش عملکرد را به فرصتهای سازمانی آینده تبدیل میکند. سازمانهایی که این مسیر را انتخاب کنند، فقط فرایند ارزیابی عملکرد خود را بهبود نمیدهند؛ بلکه سیستمهایی میسازند که تمام طیف تواناییهای انسانیِ مؤثر در موفقیت پایدار را شناسایی، پرورش و پاداش میدهند.
فناوری لازم همین حالا وجود دارد. نمونههای سازمانی آن نیز در حال شکلگیری هستند. تنها سؤال این است که آیا رهبران از هوش مصنوعی برای ادامه دادن یک سیستم ناکارآمد استفاده خواهند کرد یا آن را به چیزی تبدیل میکنند که بالاخره بتواند ویژگیهای واقعی افراد برجسته را بهدرستی ثبت و شناسایی کند.
منابع
https://hbr.org/2026/05/gen-ai-could-fix-performance-reviews-or-make-them-even-worse
ترجمه: سونیا جلالی