Apple представила сервер MCP для Safari, ускоряющий отладку веб-сайтов с помощью ИИ
Компания Apple внедряет новый сервер Model Context Protocol (MCP) для браузера Safari, который позволит агентам искусственного интеллекта напрямую проверять веб-сайты. Это нововведение предоставляет доступ к содержимому страниц, журналам консоли, сетевым запросам, снимкам экрана и другим важным данным, значительно упрощая и ускоряя процессы веб-разработки и отладки.
Содержание
Сервер Safari MCP в Safari Technology Preview 247
В недавней публикации, размещённой в блоге WebKit, Apple* сообщила, что Safari Technology Preview 247 теперь включает сервер Safari MCP. Этот сервер описывается как «сервер Model Context Protocol для веб-разработчиков, который делает рабочий процесс разработки и отладки веб-приложений быстрее и мощнее». В сообщении подчёркивается, что агенты ИИ становятся всё более важной частью процесса кодирования, а сервер Safari MCP даёт им возможность точно понимать, как код отображается в браузере, благодаря прямому подключению к окну Safari.
Открытый стандарт Model Context Protocol (MCP)
MCP (Model Context Protocol) — это открытый стандарт, изначально разработанный компанией Anthropic и впоследствии переданный Agentic AI Foundation под эгидой Linux Foundation. Его основная функция — предоставить универсальный способ для совместимых ИИ-агентов подключаться к внешним инструментам, сервисам и источникам данных. Это позволяет агентам получать необходимую информацию и выполнять авторизованные действия, не полагаясь исключительно на данные, которые пользователь вводит в чат.
На практике MCP даёт возможность таким клиентам, как ChatGPT, Claude и Gemini, подключаться к MCP-серверам, которые предоставляют доступ к разнообразным сервисам и ресурсам. Среди них GitHub, Slack, Google Drive, Notion, базы данных, локальные файлы и инструменты разработки для браузеров.
Расширенные возможности ИИ-агентов с Safari MCP
После настройки нового сервера в Safari Technology Preview 247, агенты для кодирования получают расширенные возможности. Они могут проверять веб-страницы, получать доступ к журналам консоли и сетевым запросам, делать снимки экрана, а также взаимодействовать с различными элементами на странице.
В качестве примера использования в публикации Apple* приводится сценарий отладки: если на сайте в браузере обнаружена ошибка, разработчик традиционно открывает консоль, переходит во вкладку стилей, выявляет причину и возвращается к коду для её исправления. Альтернативный и более эффективный вариант — сделать снимок экрана, подробно описать проблему агенту и поручить ему исправление. Предполагается, что агент успешно устранит ошибку. Однако, если проблема не решена, процесс повторяется: браузер, запрос, агент — до тех пор, пока ошибка не будет полностью устранена.
Независимо от используемого браузера или инструментов, традиционный процесс отладки часто требует множества кликов, переключений между различными инструментами и окнами для устранения даже одной ошибки. Сервер Safari MCP призван изменить этот подход, значительно оптимизируя процесс для разработчиков, уже использующих ИИ-агентов в своей работе, делая отладку быстрее и эффективнее.
Потенциальные применения и встроенные инструменты
В публикации также изложены несколько потенциальных применений сервера Safari MCP:
- Помощь агентам в отладке веб-сайтов.
- Выявление проблем совместимости с Safari.
- Анализ производительности веб-приложений.
- Проверка доступности (accessibility) сайтов.
- Верификация различных состояний страниц и пользовательских интерфейсов.
Кроме того, в публикации перечислены и описаны около 20 инструментов, встроенных в сервер. Среди наиболее значимых:
- browser_console_messages: Предназначен для получения буферизованных журналов консоли для текущей или указанной вкладки.
- screenshot: Позволяет захватить снимок экрана текущей страницы в формате PNG.
- list_network_requests: Используется для вывода сводок сетевых запросов (включая URL, метод, статус и время) для текущей вкладки.
- page_interactions: Обеспечивает выполнение последовательных взаимодействий с DOM-элементами, таких как клик, ввод текста, прокрутка, наведение курсора и нажатие клавиш.

